【Python/vLLM・オンプレGPU】公共系向けLLM基盤構築およびAIチャットボット開発支援
作業内容
公共系システム領域において、GitLab Duo をオンプレで活用するためのローカル LLM 基盤(vLLM+GPUサーバ3台)の構築と、並行してAIチャットボット開発を支援いただくポジションです。 主な作業内容: ・H100クラス相当GPUを搭載したオンプレサーバ3台による vLLM 推論環境の設計・構築 ・GitLab Duo 等のAIコーディング支援をオンプレで利用するためのLLM推論基盤整備 ・GPU調達待ち期間の事前検証(プロンプトエンジニアリング、RAG検討、モデル評価など) ・将来的なRAG構築やファインチューニングの検討・実装 ・LLM活用チャットボットの開発支援(会話設計、意図判定、プロンプト設計) ・物理サーバ作業に伴う三鷹拠点での初期セットアップ対応 勤務地は豊洲(貸与PC使用時)、三鷹(サーバセットアップ時)、新宿、テレワークを想定しています。
必須スキル
[必須] ・LLMを活用したシステム開発または検証の実務経験(プロンプトエンジニアリング、RAG、モデル評価 いずれか) ・Linuxサーバの構築・運用スキル ・Pythonでの開発経験(規模は不問) ・新技術のキャッチアップに前向きに取り組めること ・公共系特有のセキュリティ要件・制約下での開発に前向きに対応できること
歓迎スキル
[歓迎] ・GitLab(特にCI/CD)の利用経験 ・オンプレ環境におけるサーバ/ネットワーク/ストレージの基礎知識 ・vLLMを用いたオンプレLLM推論基盤の構築・運用経験 ・LLMベースのチャットボット開発経験
稼働条件
週5日 / 一部リモート可
面談回数
2回
契約形態
業務委託(フリーランス)
開発環境
開発・実行環境: ・LLM基盤: vLLM ・GPU: H100クラス相当(オンプレサーバ×3) ・言語: Python ・CI/CD: GitLab(Duo活用) ・OS/インフラ: Linux、オンプレミス(NW/ストレージ含む) ・手法: プロンプトエンジニアリング、RAG、モデル評価、将来的なファインチューニング ・作業形態: 豊洲・三鷹・新宿・テレワーク併用
作業時間
10:00〜18:30(実働7.5時間)
精算基準時間
140~180時間 (上下割)
募集回数
1回
募集背景
公共系システム領域において、オンプレ前提でのLLM活用需要が高まっており、GitLab Duo等のAI支援機能をセキュアに利用するための推論基盤整備と、業務利活用のチャットボット開発を強化するための増員です。 担当工程 要件定義,基本設計,詳細設計,実装,テスト,運用・保守,データ分析 募集人数 1人 チーム規模 6-10名 平均稼働時間 月間150時間目安。残業は事前許可制。 現場の雰囲気 公共系らしくセキュリティ要件を重視しつつ、新技術の検証・導入に前向きな落ち着いた環境です。 案件担当のコメント オンプレGPU×vLLMの実運用に踏み込める希少な案件です。RAGやプロンプト設計の事前検証フェーズから携われるため、LLM活用の実践知を広く深く獲得できます。物理作業は初期セットアップ中心で、以降はリモート・都内拠点併用で柔軟に対応いただけます。
募集人数
2名を予定しており、即日参画可能な方を優先的にご案内いたします。経験年数は3年以上を想定しています。フロントエンド1名、バックエンド1名の募集となります。
企業名
大手IT企業の子会社で、安定した経営基盤を持っています。詳細は面談時にご案内いたします。上場企業グループの一員として、長期的なプロジェクトを多数抱えています。
チーム人数
チーム構成はフロントエンド3名、バックエンド5名、インフラ2名となっています。プロジェクトマネージャー1名、デザイナー2名も在籍しています。総勢13名のチームで開発を進めています。
現場の雰囲気
アジャイル開発を採用しており、チーム内のコミュニケーションを大切にしています。週1回の定例会議があり、意見交換が活発です。リモートワークも可能で、柔軟な働き方ができます。
この案件のおすすめポイント
- 30代活躍中
- 新技術に積極的
- 安定稼働
- 長期案件
- 急募
- 即日参画可能
この案件を掲載しているエージェントについて

広済堂ビジネスサポート
運営会社:株式会社広済堂ビジネスサポート案件について詳しく聞いてみませんか?
知りたい内容を選んでください(複数選択可)