日本最大級のエンタメプラットフォームを提供する企業でLLM開発支援(フルリモート)

非公開

~ ¥800,000 / 月
六本木一丁目
業務委託(フリーランス)
概要

当該企業が開発する独自日本語LLMの技術責任者として、研究開発からプロダクト化・サービス運用まで一気通貫で推進していただきます。日本最大級のエンタメプラットフォームのデータを活用し、世界に通用する日本語AIを創造する挑戦的なポジションです。・独自日本語LLMのアーキテクチャ設計・実装・各サービス(ゲーム、動画、電子書籍等)データを活用したドメイン適応・高速推論基盤の構築・運用、サービス品質管理・技術チーム組成・マネジメント、外部パートナー連携■募集背景当該企業では、CTO直下のミッションクリティカルなプロジェクトとして、独自のデータ・ドメインに特化したLLM(大規模言語モデル)の設計・開発をリードする高度AI人材を募集します。当該企業ならではの強みを活かし、競合他社には真似できないAIサービスを共に創り上げていく意欲のある方を求めています。現在、AI開発は主に既存のLLMを活用したAIチャットやAIエージェントなどのサービス開発が中心ですが、当該企業が保有するユニークなデータを活用した独自LLMを開発することで、他社優位性を確立することを目指しています 。この戦略的な取り組みを推進するため、LLMのコア技術を熟知し、ゼロからモデルを設計・構築できるAIエンジニアを求めています 。

必須要件

・LLMコア技術-Transformer系モデル(GPT、LLaMA等)の実装・改良経験 3年以上-PyTorch/TensorFlowでの大規模分散学習(100B+ params)の実務経験-CUDA最適化、メモリ効率化、量子化手法の実装経験-機械学習の数学的基礎(線形代数、確率統計、最適化理論)の深い理解・日本語特化技術-日本語トークナイザー設計・最適化経験(SentencePiece、BPE等)-日本語コーパス構築・前処理パイプラインの開発経験-日本語LLM評価指標設計・ベンチマーク実装経験-マルチリンガル対応、日英翻訳品質向上の実務経験・サービス化技術-大規模推論基盤の設計・運用経験(vLLM、TensorRT-LLM等)-REST API/gRPC設計、レート制限、監視システム構築経験-A/Bテスト基盤設計、ユーザー体験最適化の実務経験-GPU利用効率化、コスト最適化、オートスケーリング実装経験

稼働量

週1〜5日六本木一丁目

求人元

FLEXY(フレキシー)

FLEXY(フレキシー)公式サイトを見る FLEXY(フレキシー)に無料登録する

※必ずしも本求人があると保証するものではありません

FLEXY(フレキシー) について
FLEXY(フレキシー) logo

FLEXY(フレキシー)

公式: https://flxy.jp/

4.5 (2件)
無料登録する

※必ずしも本求人があると保証するものではありません

関連する求人