【Python/vLLM/オンプレGPU】公共系向けLLM基盤構築・AIチャットボット開発支援
作業内容
公共系システム領域にて、GitLab Duo をオンプレ環境で活用するためのローカル LLM 基盤(GPU サーバ×3・vLLM)の構築と、並行して進む AI チャットボット開発を支援いただきます。 主な作業内容: ・H100 クラス相当 GPU を搭載したオンプレサーバ3台による vLLM 推論環境の設計・構築 ・GitLab Duo 等の AI コーディング支援をオンプレで利用するための LLM 推論基盤整備 ・GPU 調達待ち期間の事前検証(プロンプトエンジニアリング中心、RAG 検討、モデル評価 等) ・将来的な RAG 構築やファインチューニングの検討・実装 ・LLM を活用した AI チャットボット開発支援(会話設計、意図判定、プロンプト整備)
必須スキル
オンプレGPU 必須スキル: ・LLM を活用したシステム開発または検証経験(プロンプトエンジニアリング、RAG、モデル評価 など) ・Linux サーバの構築・運用スキル ・Python での開発経験(規模不問) ・新技術のキャッチアップに前向きに取り組める方 ・公共系特有のセキュリティ要件や各種制約下での開発に前向きに対応できる方
歓迎スキル
歓迎スキル: ・GitLab(CI/CD)の利用経験 ・オンプレ環境におけるサーバ構築、ネットワーク、ストレージの基礎知識 ・vLLM を用いたオンプレ LLM 推論基盤の構築・運用経験 ・LLM ベースのチャットボット設計・開発経験
稼働日数
目安150時間/月、残業は事前許可制
勤務形態
一部リモート
勤務地
東京都 豊洲駅 東京都 江東区 豊洲
面談回数
3回
開発環境
開発・実行環境: ・LLM 基盤: vLLM ・GPU: H100 クラス相当(オンプレサーバ×3台構成) ・言語: Python ・CI/CD: GitLab(Duo 含む) ・OS/基盤: Linux(オンプレミス)、NW/ストレージあり ・検証: プロンプトエンジニアリング、RAG、モデル評価
作業時間
10:00〜18:30(実働7.5時間)
精算基準時間
150〜150時間
募集回数
1回
募集背景
オンプレGPU×vLLMの基盤整備からチャットボット実装まで幅広く関われる案件です。公共系のためセキュリティ要件が厳しめですが、その分レアなオンプレLLMの実務経験を積む好機です。
募集背景
この案件は、新規プロジェクトの立ち上げに伴い、経験豊富なエンジニアを募集しています。チームは10名規模で、アジャイル開発を採用しています。現場の雰囲気は和やかで、コミュニケーションを大切にしています。
募集人数
2名を予定しており、即日参画可能な方を優先的にご案内いたします。経験年数は3年以上を想定しています。フロントエンド1名、バックエンド1名の募集となります。
企業名
大手IT企業の子会社で、安定した経営基盤を持っています。詳細は面談時にご案内いたします。上場企業グループの一員として、長期的なプロジェクトを多数抱えています。
チーム人数
チーム構成はフロントエンド3名、バックエンド5名、インフラ2名となっています。プロジェクトマネージャー1名、デザイナー2名も在籍しています。総勢13名のチームで開発を進めています。
現場の雰囲気
アジャイル開発を採用しており、チーム内のコミュニケーションを大切にしています。週1回の定例会議があり、意見交換が活発です。リモートワークも可能で、柔軟な働き方ができます。
案件について詳しく聞いてみませんか?
知りたい内容を選んでください(複数選択可)