【Python/vLLM/GPU】公共系向けオンプレLLM基盤構築・AIチャットボット開発支援
作業内容
公共系システム領域にて、GitLab Duo をオンプレ環境で活用するためのローカル LLM 基盤(GPU サーバ3台+vLLM)の構築と、並行するAIチャットボットの開発支援をご担当いただきます。 主な作業内容: ・H100クラス相当GPUを搭載したオンプレサーバ3台での vLLM 推論環境の設計・構築 ・GitLab Duo 等のAIコーディング支援をオンプレで利用するためのLLM推論基盤の整備 ・GPU調達待ち期間中のプロンプトエンジニアリング中心の事前検証(RAG/評価/プロンプト最適化) ・将来的なRAG構築およびファインチューニングの検討・実装 ・LLM活用チャットボット開発支援(会話設計、意図判定、プロンプト整備) ・物理サーバ作業に伴う三鷹拠点での初期セットアップ 勤務地は豊洲(顧客PC借用時)、三鷹(サーバセットアップ時)、新宿、テレワークを想定しています。稼働は10:00〜18:30(実働7.5h)、残業は事前許可制です。
必須スキル
[必須スキル] ・LLM を活用したシステム開発または検証経験(プロンプトエンジニアリング、RAG、モデル評価など) ・Linux サーバの構築・運用スキル ・Python での開発経験(規模不問) ・新技術のキャッチアップに前向きに取り組める方 ・公共系特有のセキュリティ要件・制約下での開発に前向きに対応できる方
歓迎スキル
[歓迎スキル] ・GitLab(CI/CD)の利用経験 ・オンプレミス環境でのサーバ構築、ネットワーク、ストレージに関する基礎知識 ・vLLM を用いたオンプレ LLM 推論基盤の構築・運用経験 ・LLMベースのチャットボット開発経験
稼働条件
週5日 / 一部リモート可
面談回数
1回
契約形態
業務委託(フリーランス)
開発環境
開発/運用環境: ・LLM推論: vLLM(オンプレGPU/H100クラス相当、サーバ3台構成) ・言語: Python ・CI/CD: GitLab(Duo想定) ・OS/基盤: Linux(オンプレサーバ、NW/ストレージあり) ・関連: プロンプトエンジニアリング、RAG、モデル評価、将来的な微調整(ファインチューニング)
作業時間
定時 10:00〜18:30(実働7.5時間)
精算基準時間
150~150時間 (中割)
募集回数
1回
募集背景
公共系領域におけるオンプレミスでのAI活用需要増に伴い、GitLab Duo のオンプレ利用を見据えたLLM推論基盤の新規構築とチャットボット開発支援体制を強化するための増員です。 担当工程 要件定義,基本設計,詳細設計,実装,テスト,運用・保守,データ分析 募集人数 1人 チーム規模 6-10名 平均稼働時間 平均150時間/月を目安(時給精算) 現場の雰囲気 公共系案件のため落ち着いた環境。新技術の検証にも前向きで、ドキュメント整備や手順遵守を重視。 案件担当のコメント GPU到着前はプロンプトエンジニアリング中心に検証を進め、到着後はvLLM基盤の構築にスムーズに移行します。公共系のためセキュリティ基準順守に理解のある方を歓迎します。
募集人数
2名を予定しており、即日参画可能な方を優先的にご案内いたします。経験年数は3年以上を想定しています。フロントエンド1名、バックエンド1名の募集となります。
企業名
大手IT企業の子会社で、安定した経営基盤を持っています。詳細は面談時にご案内いたします。上場企業グループの一員として、長期的なプロジェクトを多数抱えています。
チーム人数
チーム構成はフロントエンド3名、バックエンド5名、インフラ2名となっています。プロジェクトマネージャー1名、デザイナー2名も在籍しています。総勢13名のチームで開発を進めています。
現場の雰囲気
アジャイル開発を採用しており、チーム内のコミュニケーションを大切にしています。週1回の定例会議があり、意見交換が活発です。リモートワークも可能で、柔軟な働き方ができます。
この案件のおすすめポイント
- 30代活躍中
- 新技術に積極的
- 安定稼働
- 長期案件
- 急募
- 即日参画可能
この案件を掲載しているエージェントについて

広済堂ビジネスサポート
運営会社:株式会社広済堂ビジネスサポート案件について詳しく聞いてみませんか?
知りたい内容を選んでください(複数選択可)