日本最大級のエンタメプラットフォームを提供する企業でLLM開発支援(フルリモート)
非公開
当該企業が開発する独自日本語LLMの技術責任者として、研究開発からプロダクト化・サービス運用まで一気通貫で推進していただきます。日本最大級のエンタメプラットフォームのデータを活用し、世界に通用する日本語AIを創造する挑戦的なポジションです。・独自日本語LLMのアーキテクチャ設計・実装・各サービス(ゲーム、動画、電子書籍等)データを活用したドメイン適応・高速推論基盤の構築・運用、サービス品質管理・技術チーム組成・マネジメント、外部パートナー連携■募集背景当該企業では、CTO直下のミッションクリティカルなプロジェクトとして、独自のデータ・ドメインに特化したLLM(大規模言語モデル)の設計・開発をリードする高度AI人材を募集します。当該企業ならではの強みを活かし、競合他社には真似できないAIサービスを共に創り上げていく意欲のある方を求めています。現在、AI開発は主に既存のLLMを活用したAIチャットやAIエージェントなどのサービス開発が中心ですが、当該企業が保有するユニークなデータを活用した独自LLMを開発することで、他社優位性を確立することを目指しています 。この戦略的な取り組みを推進するため、LLMのコア技術を熟知し、ゼロからモデルを設計・構築できるAIエンジニアを求めています 。
・LLMコア技術-Transformer系モデル(GPT、LLaMA等)の実装・改良経験 3年以上-PyTorch/TensorFlowでの大規模分散学習(100B+ params)の実務経験-CUDA最適化、メモリ効率化、量子化手法の実装経験-機械学習の数学的基礎(線形代数、確率統計、最適化理論)の深い理解・日本語特化技術-日本語トークナイザー設計・最適化経験(SentencePiece、BPE等)-日本語コーパス構築・前処理パイプラインの開発経験-日本語LLM評価指標設計・ベンチマーク実装経験-マルチリンガル対応、日英翻訳品質向上の実務経験・サービス化技術-大規模推論基盤の設計・運用経験(vLLM、TensorRT-LLM等)-REST API/gRPC設計、レート制限、監視システム構築経験-A/Bテスト基盤設計、ユーザー体験最適化の実務経験-GPU利用効率化、コスト最適化、オートスケーリング実装経験
週1〜5日六本木一丁目
FLEXY(フレキシー)
FLEXY(フレキシー) について

※必ずしも本求人があると保証するものではありません