掲載終了4ヶ月前

【フルリモ！/最先端技術活用！】LLMを活用した設計図自動生成の研究開発における強化学習エンジニア募集！

850,000/月

作業内容

■募集背景乗り物（船舶・自動車・航空等想定）の設計書・仕様書を対象に、特化型LLMを構築・高度化する取り組みを加速。モデル構築面（データ整備〜学習〜評価〜強化学習）で実務に即した技術助言と精度向上の牽引が必要となったため、LLM強化学習（RL）に通じた方を募集しております。 ■ご担当業務（お任せしたい工程）・設計書・仕様書コーパスの前処理・分割・匿名化・正規化に関する方針策定・SFT → RLHF（PPO/DPO等）を含む学習パイプラインの設計・改善・評価設計（helpfulness / harmlessness / honesty 等）とメトリクス運用・エラー分析／失敗例の体系化、データ追加・報酬設計・プロンプト/方針更新提案・ABテスト／回帰テストの仕組み化、モデル曲線の読み解きと次アクション提示・週次レビュー、課題管理、ドキュメント整備（日本語中心／英語文献読解あり） ■プロジェクトの進捗状況 3月より開始予定

必須スキル

■必須スキル・LLMの強化学習（RL）の実務経験をお持ちの方・PPO / DPO / RLHF によるモデル最適化の実務・SFT → RLHF の一連パイプライン構築経験・データ整備・加工・学習の実務経験（ドメイン文書の前処理・分割・メタ情報設計）・LLM評価（helpfulness / harmlessness / honesty 等）設計・運用の経験・論文ベース検証／英日での文献読解・ロジカルな説明力／ステークホルダーとの高頻度コミュニケーション ■歓迎スキル・設計文書の構造理解・セキュリティ／コンプライアンスに配慮したデータガバナンス実務

稼働条件

フルリモート

契約形態

業務委託(準委任契約)

開発環境

Flask, Python, Tensorflow

募集回数

1回

募集背景

🌟特化型LLM × 強化学習（RLHF）の“最先端”に携われる乗り物（船舶・自動車・航空）の設計書という高難度ドメインを対象に、 SFT → RLHF（PPO/DPO）までのフルパイプライン構築をリードできる希少案件。 🌟モデル精度改善の“技術意思決定レイヤー”を担当できるデータ整備・評価設計・報酬設計・エラー分析など、モデルの性能を左右するコア部分の裁量が大きい上級ポジション。 🌟3月スタートの新規フェーズで立ち上げから参画できるプロジェクト開始タイミングに入り、設計・運用ルールの策定から関われるため、実績・経験の幅が広がる！

職種・ポジション

サーバーサイドエンジニア

スキル

バックエンド:

Python Flask Tensorflow

その他:

ABテスト

企業名

サービス/プロジェクト名

詳細スケジュール/リリース時期

現場責任者の雰囲気

開発体制の詳細

詳細は面談でお伝えします。ご相談ください。

一部の情報は非公開の場合があります

3件以上の応募でご希望の条件の案件に参画しやすくなります

人気案件は申し込みが集中します。ご相談はお早めに！

この案件を掲載しているエージェントについて

Remoguフリーランス

運営会社：株式会社LASSIC（ラシック）

支払いサイト：

支払いサイトは案件や契約条件ごとに確認します。契約前に締め日、入金日、精算幅、振込手数料、契約形態を確認します。

案件について詳しく聞いてみませんか？

知りたい内容を選んでください（複数選択可）

フリーランス案件と正社員求人の違いを知りたい

自分の経験に基づいた単価相場を知りたい

リモートワークで参加可能な案件を探したい

自分のスキルに合った案件を探したい

プロジェクトでの裁量権の範囲を知りたい

都道府県で絞り込む

関東

サーバーサイドエンジニア × 東京都サーバーサイドエンジニア × 神奈川県

近畿

サーバーサイドエンジニア × 大阪府

【フルリモ！/最先端技術活用！】LLMを活用した設計図自動生成の研究開発における強化学習エンジニア募集！