求人詳細

トランスフォーメーション領域：データサイエンティスト（LLM開発）

No.JN00497270

正社員

募集要項
企業名	株式会社ABEJA
職種	データサイエンティスト(Web) 、機械学習エンジニア(その他)
試用期間	試用期間：原則3ヶ月。職種によって異なります
業務内容	【募集背景】 ABEJAは創業以来、高い技術力と顧客に寄り添う提案力を武器に、多くのAIソリューションやプロダクトを社会実装してきました。近年は大規模言語モデル（LLM）や生成AIの進化により、ミッションクリティカルな領域を含む幅広い業務で、生成AI活用の中核化が急速に進んでいます。一方で、ミッションクリティカル業務では高いセキュリティや信頼性、専門的な業務知識への対応が不可欠であり、クラウド型の汎用LLMの活用には制約が生じやすいのが現実です。また、取り扱うデータの性質上、処理を自社環境内で完結させたいというニーズも大きく、ローカル環境での高性能なモデル提供と、それを支える開発・運用基盤の整備が重要性を増しています。日進月歩で進化を続ける大規模言語モデルの開発の取り組みをさらに拡大・牽引し、研究開発から基盤整備、評価設計、データエンジニアリングまでを通じて、生成AI時代のミッションクリティカル領域における価値提供を強化していただきたいと考えています。【ミッション】 ▼「テクノロジーの力で産業構造を変革する」生成AIが業務の中核へ入り込む時代において、ミッションクリティカル領域でも安心して使えるLLMを研究開発し、社会実装可能な形で届けることで、お客様の経営課題／事業課題を根本から解決へ導きます。そのために本ポジションでは、大規模言語モデル（視覚言語モデルを含む）の研究開発を推進し、データ設計・学習／評価・推論最適化・運用を見据えた開発基盤整備までを一体で担います。プロジェクトマネージャなどのビジネスサイド、プロダクト／プラットフォームを支えるエンジニアと密に連携しながら、要件に沿ったモデル方針の策定から、品質を担保するベンチマーク設計、継続的な改善サイクルの確立まで、価値提供の中核をリードしていただきます。また、組織として研究開発力を継続的に高めるため、知見の体系化や開発プロセスの標準化、メンバー育成やカルチャー醸成にも主体的に関わり、ABEJAが描く未来を共に創っていただきます。【業務内容】高い性能と利便性を両立する国産大規模言語モデルの開発、改善、研究を中核として推進いただくポジションです。単にモデルを作って終わりではなく、得られた成果をプロダクトやソリューションへ落とし込み、業務価値として継続的に届け切るところまで一気通貫で担っていただきます。 ▼大規模言語モデル（LLM）の開発・改善・研究・モデルアーキテクチャ、学習手法、推論最適化に関する調査・設計・実装・継続事前学習、指示チューニング、アライメント、強化学習等による性能向上・長文対応、ツール利用、エージェント化を見据えた能力拡張の検討・日本語および業務特化領域での品質・安全性・信頼性の向上に向けた改善サイクルの確立 ▼評価・ベンチマーク設計・日本語／業務ドメインに即したベンチマークの設計・運用・オフライン評価とオンライン評価の設計、継続的な性能モニタリングと劣化検知・ハルシネーション、情報漏洩、プライバシー等のリスクを踏まえた検証と対策 ▼開発基盤・データ基盤の整備・学習／評価／推論のパイプライン設計・運用、再現性の高い実験環境の構築・データ収集、品質管理、フィルタリング、アノテーション方針の策定と運用・コストやスループットを意識した推論環境の最適化、LLM Opsの整備 ▼プロダクト／ソリューションへの接続・PM／PdMと連携した要求整理、ロードマップへの反映、要件に沿ったモデル方針の策定・エンジニアと連携した商用実装（API化、周辺機能、運用設計）、クライアント環境での導入支援（オンプレミス含む）・業務プロセスへの組み込み、検証設計、運用定着までの伴走と改善・再利用可能なコンポーネント化やプロダクト化による横展開 ▼チームリーディング、技術横展開・技術発信・技術アプローチレビュー、コードレビュー、ナレッジ共有を通じた開発品質の向上・メンバー育成やカルチャー醸成への貢献・技術ナレッジの公開（論文投稿・学会発表・勉強会登壇・テックブログ等）【あなたは何を得られるのか（ポジションの魅力）】・少数精鋭のチームで、国産大規模言語モデルの研究開発に高い裁量を持って取り組むことができます。性能向上や新規手法の検証にとどまらず、開発したLLMをプロダクト／ソリューションへ落とし込み、クライアントの業務価値として届け切るところまで一気通貫で担える点が、本ポジションの最大の魅力です。・受注前から顧客やPMと議論し、課題設定や要件定義といった上流工程から関与できます。モデルの要件（性能／コスト／セキュリティ／運用制約）をビジネス要求に接続し、価値提供の形に落とし込む経験を通じて、研究開発力に加えて「社会実装する力」を大きく伸ばすことができます。・また、ミッションクリティカル領域で求められる高い信頼性・ガバナンス・運用性を前提に、データ設計、学習／評価基盤、推論最適化、LLM Opsまでを含む総合的な開発経験を積むことができます。実運用の制約下で性能と利便性を両立させるための意思決定や設計は、汎用的なLLM活用だけでは得づらい専門性となります。・ABEJAは大手企業の業務やデータに向き合いながら社会実装を重ねてきた知見があり、その座組みだからこそ、実データ・実業務に根差した面白いテーマに挑戦できます。優秀なメンバーとの協働やレビューを通じて学びを深められる環境があり、新規技術検証、論文読み会、カンファレンス登壇、技術ブログなどのアウトプットも後押しする文化があります。・LLMを活用するだけでなく、LLMそのものを開発し、改善し、価値提供まで推進する。研究開発と社会実装の両輪で成長したい方にとって、挑戦機会の大きいポジションです。
応募条件	【必須要件】・機械学習モデルの研究、開発経験（3年以上）・大規模言語モデルの学習経験（規模は問わない）　- ログレベルでエラーを追いかけて適切な仮説だしと対処を実施した経験・大規模言語モデルの研究開発分野の最先端を追いかけ続ける高い熱量【歓迎要件】・NVIDIA社のMegatron-LMやNeMoフレームワークを使用した開発経験・MLOps環境の構築・運用経験、分散処理の経験・外部活動における実績　- Kaggleをはじめとしたデータサイエンスコンペへの参加・上位入賞経験　- データサイエンス領域におけるカンファレンス登壇経験　- 登壇やブログの執筆など、積極的な外部発信　- ジャーナルでの論文採用経験　- OSS貢献・英語による日常会話・チャットに抵抗がないこと　- あくまでも「抵抗がないこと」レベルであり、得意でなくても構いません
勤務地	東京都港区三田一丁目1番14号Bizflex麻布十番2階最寄駅：【最寄り駅】各線麻布十番駅から徒歩3分
給与・報酬	想定年収800万円〜1500万円特記事項：【給与】経験・能力を考慮の上、当社規定により決定させて頂きます。月あたり40時間分のみなし残業代を含んでいます。
就業時間	10:00〜19:00 休憩時間：60分コアタイム：10:00〜15:00 特記事項：※フレキシブルタイム 07：00～10：00／15：00～19：00 フレックスタイム制
休暇・休日	・完全週休2日制（土曜・日曜）、国民の祝日・年次有給休暇（初年度10日）・リフレッシュ休暇（初年度最大3日）・その他（慶弔、ゴールデンウィーク、年末年始、子の看護、介護など）
待遇・福利厚生	健康保険,厚生年金保険,労災保険,雇用保険交通費：※交通費は実費精算致します。諸手当：深夜・休日勤務手当、追加割増手当、時間外労働手当子ども手当：親権を持つ満20歳までの子供1名につき、試用期間後より月1万円を支給特記事項：【加入保険】健康保険：関東ITソフトウェア健康保険組合に加入（直営の保養施設などの利用可）【福利厚生】・健康診断：年1回、健康保険加入者を対象に実施・成長支援制度：自身のミッションを達成するために必要なコンテンツ（書籍・電子書籍・オンライン講座など）事前承認なしで会社経費にて購入可能・結婚出産祝い金：従業員が結婚、または従業員に子が生まれた場合、お祝い金として3万円を支給 ※他にも複数の制度がございます。【受動喫煙防止情報】屋内受動喫煙対策：対策あり
こだわり条件	学歴不問英語力を活かせる経験者優遇駅から徒歩5分以内 10時以降出社OK 土日祝日休み交通費支給社会保険完備家族手当育児支援制度完全週休二日制フレックスタイム制（コアタイムあり）

あなたにオススメの求人一覧

トランスフォーメーション領域：データサイエンティスト（LLM開発）

募集要項

企業名

職種

試用期間

業務内容

応募条件

勤務地

給与・報酬

就業時間

休暇・休日

待遇・福利厚生

こだわり条件

こだわり条件から探す

経験・スキルから探す

業界から探す

勤務地から探す