【Python/vLLM・オンプレGPU】公共系向けLLM基盤構築およびAIチャットボット開発支援

掲載終了6ヶ月前

【Python/vLLM・オンプレGPU】公共系向けLLM基盤構築およびAIチャットボット開発支援

650,000〜700,000/月

作業内容

公共系システム領域において、GitLab Duo をオンプレで活用するためのローカル LLM 基盤（vLLM＋GPUサーバ3台）の構築と、並行してAIチャットボット開発を支援いただくポジションです。主な作業内容: ・H100クラス相当GPUを搭載したオンプレサーバ3台による vLLM 推論環境の設計・構築・GitLab Duo 等のAIコーディング支援をオンプレで利用するためのLLM推論基盤整備・GPU調達待ち期間の事前検証（プロンプトエンジニアリング、RAG検討、モデル評価など）・将来的なRAG構築やファインチューニングの検討・実装・LLM活用チャットボットの開発支援（会話設計、意図判定、プロンプト設計）・物理サーバ作業に伴う三鷹拠点での初期セットアップ対応勤務地は豊洲（貸与PC使用時）、三鷹（サーバセットアップ時）、新宿、テレワークを想定しています。

必須スキル

[必須] ・LLMを活用したシステム開発または検証の実務経験（プロンプトエンジニアリング、RAG、モデル評価いずれか）・Linuxサーバの構築・運用スキル・Pythonでの開発経験（規模は不問）・新技術のキャッチアップに前向きに取り組めること・公共系特有のセキュリティ要件・制約下での開発に前向きに対応できること

歓迎スキル

[歓迎] ・GitLab（特にCI/CD）の利用経験・オンプレ環境におけるサーバ／ネットワーク／ストレージの基礎知識・vLLMを用いたオンプレLLM推論基盤の構築・運用経験・LLMベースのチャットボット開発経験

稼働条件

週5日 / 一部リモート可

面談回数

2回

契約形態

業務委託(フリーランス)

開発環境

開発・実行環境: ・LLM基盤: vLLM ・GPU: H100クラス相当（オンプレサーバ×3）・言語: Python ・CI/CD: GitLab（Duo活用）・OS/インフラ: Linux、オンプレミス（NW/ストレージ含む）・手法: プロンプトエンジニアリング、RAG、モデル評価、将来的なファインチューニング・作業形態: 豊洲・三鷹・新宿・テレワーク併用

作業時間

10:00〜18:30（実働7.5時間）

精算基準時間

140~180時間 (上下割)

募集回数

1回

募集背景

公共系システム領域において、オンプレ前提でのLLM活用需要が高まっており、GitLab Duo等のAI支援機能をセキュアに利用するための推論基盤整備と、業務利活用のチャットボット開発を強化するための増員です。担当工程要件定義,基本設計,詳細設計,実装,テスト,運用・保守,データ分析募集人数 1人チーム規模 6-10名平均稼働時間月間150時間目安。残業は事前許可制。現場の雰囲気公共系らしくセキュリティ要件を重視しつつ、新技術の検証・導入に前向きな落ち着いた環境です。案件担当のコメントオンプレGPU×vLLMの実運用に踏み込める希少な案件です。RAGやプロンプト設計の事前検証フェーズから携われるため、LLM活用の実践知を広く深く獲得できます。物理作業は初期セットアップ中心で、以降はリモート・都内拠点併用で柔軟に対応いただけます。