【フルリモ!/最先端技術活用!】LLMを活用した設計図自動生成の研究開発における強化学習エンジニア募集!

募集中1ヶ月前

【フルリモ!/最先端技術活用!】LLMを活用した設計図自動生成の研究開発における強化学習エンジニア募集!

850,000/月
全国(フルリモートのため)/フルリモート
要確認

作業内容

■募集背景 乗り物(船舶・自動車・航空等想定)の設計書・仕様書を対象に、特化型LLMを構築・高度化する取り組みを加速。 モデル構築面(データ整備〜学習〜評価〜強化学習)で実務に即した技術助言と精度向上の牽引が必要となったため、LLM強化学習(RL)に通じた方を募集しております。 ■ご担当業務(お任せしたい工程) ・設計書・仕様書コーパスの前処理・分割・匿名化・正規化に関する方針策定 ・SFT → RLHF(PPO/DPO等) を含む学習パイプラインの設計・改善 ・評価設計(helpfulness / harmlessness / honesty 等)とメトリクス運用 ・エラー分析/失敗例の体系化、データ追加・報酬設計・プロンプト/方針更新提案 ・ABテスト/回帰テストの仕組み化、モデル曲線の読み解きと次アクション提示 ・週次レビュー、課題管理、ドキュメント整備(日本語中心/英語文献読解あり) ■プロジェクトの進捗状況 3月より開始予定

必須スキル

■必須スキル ・LLMの強化学習(RL)の実務経験をお持ちの方 ・PPO / DPO / RLHF によるモデル最適化の実務 ・SFT → RLHF の一連パイプライン構築経験 ・データ整備・加工・学習の実務経験(ドメイン文書の前処理・分割・メタ情報設計) ・LLM評価(helpfulness / harmlessness / honesty 等)設計・運用の経験 ・論文ベース検証/英日での文献読解 ・ロジカルな説明力/ステークホルダーとの高頻度コミュニケーション ■歓迎スキル ・設計文書の構造理解 ・セキュリティ/コンプライアンスに配慮したデータガバナンス実務

稼働日数

要確認

勤務形態

フルリモート

勤務地

全国(フルリモートのため)

開発環境

Flask, Python, Tensorflow

募集回数

1回

募集背景

🌟特化型LLM × 強化学習(RLHF)の“最先端”に携われる 乗り物(船舶・自動車・航空)の設計書という高難度ドメインを対象に、 SFT → RLHF(PPO/DPO)までのフルパイプライン構築をリードできる希少案件。 🌟モデル精度改善の“技術意思決定レイヤー”を担当できる データ整備・評価設計・報酬設計・エラー分析など、 モデルの性能を左右するコア部分の裁量が大きい上級ポジション。 🌟3月スタートの新規フェーズで立ち上げから参画できる プロジェクト開始タイミングに入り、 設計・運用ルールの策定から関われるため、実績・経験の幅が広がる!

スキル

バックエンド:
その他:

募集背景

この案件は、新規プロジェクトの立ち上げに伴い、経験豊富なエンジニアを募集しています。チームは10名規模で、アジャイル開発を採用しています。現場の雰囲気は和やかで、コミュニケーションを大切にしています。

募集人数

2名を予定しており、即日参画可能な方を優先的にご案内いたします。経験年数は3年以上を想定しています。フロントエンド1名、バックエンド1名の募集となります。

企業名

大手IT企業の子会社で、安定した経営基盤を持っています。詳細は面談時にご案内いたします。上場企業グループの一員として、長期的なプロジェクトを多数抱えています。

面談でお伝えできます。
ぜひご相談ください。
一部非公開の場合がございます

チーム人数

チーム構成はフロントエンド3名、バックエンド5名、インフラ2名となっています。プロジェクトマネージャー1名、デザイナー2名も在籍しています。総勢13名のチームで開発を進めています。

現場の雰囲気

アジャイル開発を採用しており、チーム内のコミュニケーションを大切にしています。週1回の定例会議があり、意見交換が活発です。リモートワークも可能で、柔軟な働き方ができます。

案件について詳しく聞いてみませんか?

知りたい内容を選んでください(複数選択可)