【AIエンジニア】NVIDIA GB200を用いた超長尺エピゲノム言語モデルの分散事前学習開発の求人・案件

募集中NEW2日前

【AIエンジニア】NVIDIA GB200を用いた超長尺エピゲノム言語モデルの分散事前学習開発の求人・案件

〜2,500,000/月

作業内容

AI×医療・バイオ領域における最先端の生成AI基盤モデル開発。 ・1兆データポイントのエピゲノムデータを用いた言語モデルの設計およびフルスクラッチ事前学習 ・GB200(複数ノード)を用いた大規模分散事前学習環境の構築・最適化 ・数千万規模の超長尺コンテキストに対応するモデル構造(Mambaやコンテキスト並列等)の検討・実装 ※分散学習時のメモリ・通信ボトルネックを自力で解決する挑戦的なR&Dポジションです。

必須スキル

– マルチノードGPU環境における大規模モデルの分散事前学習経験(または同等の知見) – PyTorch、DeepSpeed、Megatron-LM等を用いた並列学習(テンソル/パイプライン/コンテキスト並列)の実装・最適化経験 – OOMや通信ボトルネック発生時、CUDAや通信レイヤーを含めて原因特定・解決できる高度なトラブルシューティング能力 – 超長尺コンテキストを扱う代替バックボーン(Mamba、状態空間モデル等)への強い関心とキャッチアップ力

歓迎スキル

– 数B〜数十B規模以上のモデルのフルスクラッチ事前学習・継続事前学習経験 – Ring AttentionやSequence Parallelism等の超長尺処理技術の知見 – AWS(SageMaker HyperPod等)/GCP/Azureでの大規模GPUクラスタ構築・運用経験 – NVIDIA Blackwell(GB200/B200)環境での開発経験 – バイオインフォマティクスやオミクスデータの解析知見、トップカンファレンス論文の実装・再現経験

稼働条件

週4日 / 週5日 / 常駐

面談回数

1

契約形態

準委任(個人事業主)

開発環境

環境・ツール: AWS / Azure / GCP フレームワーク・ライブラリ: PyTorch

募集回数

1回

職種・ポジション

スキル

バックエンド:
AIツール・LLMサービス:

募集背景

この案件は、新規プロジェクトの立ち上げに伴い、経験豊富なエンジニアを募集しています。チームは10名規模で、アジャイル開発を採用しています。現場の雰囲気は和やかで、コミュニケーションを大切にしています。

募集人数

2名を予定しており、即日参画可能な方を優先的にご案内いたします。経験年数は3年以上を想定しています。フロントエンド1名、バックエンド1名の募集となります。

企業名

大手IT企業の子会社で、安定した経営基盤を持っています。詳細は面談時にご案内いたします。上場企業グループの一員として、長期的なプロジェクトを多数抱えています。

面談でお伝えできます。
ぜひご相談ください。
一部非公開の場合がございます

チーム人数

チーム構成はフロントエンド3名、バックエンド5名、インフラ2名となっています。プロジェクトマネージャー1名、デザイナー2名も在籍しています。総勢13名のチームで開発を進めています。

現場の雰囲気

アジャイル開発を採用しており、チーム内のコミュニケーションを大切にしています。週1回の定例会議があり、意見交換が活発です。リモートワークも可能で、柔軟な働き方ができます。

案件について詳しく聞いてみませんか?

知りたい内容を選んでください(複数選択可)