企業名 |
株式会社APTO |
職種 |
AIエンジニア(その他)
、 機械学習エンジニア(その他)
|
業務内容 |
【募集背景】
APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。
近年、AIモデルの進化に伴い、競争力の源泉はモデル構造そのものから、「どのようなデータを、どのように設計し、評価し、改善し続けられるか」へと急速にシフトしています。
特に、
・LLM/VLM/マルチモーダルモデルの高度化
・本番運用を前提とした大規模データ要求
・データ品質がモデル性能を直接左右する構造
が同時に進み、AI開発におけるボトルネックは完全に「データ側」に移行しています。
さらに現在は、
・有害データの混入
・バイアスの増幅
・誤学習によるリスク
・評価指標と実運用性能の乖離
といった AIの安全性・信頼性に関わる課題 が顕在化しており、データ設計は単なる精度改善の問題ではなく、AIの社会実装における責任領域へと拡張しています。
APTOでは現在、
・データ設計や評価が属人的に行われている
・モデル改善のボトルネックがデータ側にあるが体系化されていない
・安全性・品質・性能を統合した設計思想が未確立
という課題を抱えており、AIモデル性能と安全性を「データの観点から」引き上げられるResearch Engineerを募集します。
【このポジションの本質】
AIモデルが正しく学習され、安全性・信頼性を担保し、本番環境で信頼できる性能を発揮する状態を、データ設計と評価ループの構築によって実現することを担っていただくポジションです。
扱う対象は単なる学習データではなく、
・モデルの挙動を規定する訓練信号
・評価基準を形作るテストデータ
・安全性を担保するガードレールデータ
といった、AIのモデルの出力特性と性能を規定する要素です。
そのため本ポジションでは、
・どのデータがモデルの意思決定に影響するのか
・どの評価が本番性能を適切に測定できるのか
・どのようなデータ設計が安全性を担保するのか
といった問いに対し、研究的視点と実装視点の両方から取り組むことが求められます。
【主な役割】
・LLM/VLM/マルチモーダルモデル向けの学習データ設計
・データ前処理・アノテーション方針の設計と改善
・モデル評価指標の設計および評価結果の分析
・学習 → 評価 → データ改善 のフィードバックループ構築
・モデル開発チームとの連携による性能改善
・データ品質・バイアス・安全性に関する設計指針の確立
【研究テーマとしての領域】
本ポジションでは、以下のような研究的テーマに取り組んでいただく想定です。
▼データ設計領域
・モデル性能を最大化するデータ分布設計
・データカバレッジと一般化性能の関係
・少量データ環境での効率的データ生成
▼評価領域
・モデルの実運用性能を反映する評価指標の設計
・評価データセットの品質設計
・自動評価と人手評価の統合設計
▼AI安全性領域
・有害出力を抑制する訓練データ設計
・バイアス・公平性に関するデータ分析
・安全性評価データセット(ベンチマーク)の設計
・データガバナンス・トレーサビリティ設計
・SFT、RLHFによるモデルの性能向上
【主軸(最も期待する領域)】
・AIモデル向けデータ設計・品質管理
・モデル評価とデータ改善ループの設計
・Pythonを用いたデータ処理・分析
・データ視点からのモデル性能改善
【扱う対象例】
・LLM/VLM 向けテキスト・画像・動画データ
・物体検知・画像認識モデル向けデータ
・アノテーションデータ・メタデータ
・安全性評価用データセット
【このポジションで得られるもの】
・AIモデル性能を左右するデータ設計の実務経験
・最新のLLM/VLM を実運用レベルで扱う希少な機会
・AIの安全性・信頼性に関わる最前線の課題に取り組む経験
・研究とプロダクト開発を横断したキャリア
※ハイブリッド勤務(リモートと出社の併用)
|
応募条件 |
【必須スキル】
・機械学習またはAI関連プロジェクトにおいて、データ前処理・分析・評価設計に関わった経験がある方
・Pythonを用いたデータ処理・分析経験をお持ちの方
・モデル性能に対して「データの観点から」改善に取り組んだ経験がある方
・AIの品質・安全性・バイアス・評価指標といったテーマに関心をお持ちの方
【歓迎スキル】
・LLM/VLM/画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
・アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
・精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
・学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
・Data-centric AI/MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
・研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方
・生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方
・強化学習を含む学習手法や、課題設定~分析~実装~検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
・Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方
【求める人物像】
・LLM/VLM/マルチモーダルモデルに関する実務経験
・評価データセット設計・モデル評価指標設計の経験
・データ品質管理やアノテーション設計の経験
・AI安全性・公平性・バイアスに関する研究または実務経験
・論文実装・研究活動・学会発表などの経験
|
勤務地 |
東京都千代田区岩本町2-4-1神田岩本町プラザビル504 最寄駅:【最寄り駅】都営地下鉄新宿線 岩本町駅から徒歩3分
東京メトロ日比谷線 小伝馬町駅から徒歩6分
各線 秋葉原駅から徒歩6分 |
給与・報酬 |
想定年収600万円〜1500万円 特記事項:応相談(経験等に応じて600万円~1500万円程度を想定)
|
就業時間 |
コアタイム:11:00〜15:00 特記事項:フレックスタイム制
|
休暇・休日 |
・年次有給休暇
・土日祝日
・夏季休暇
・年末年始休暇
・慶弔休暇
・産前産後休暇
・育児休暇
・生理休暇
|
待遇・福利厚生 |
健康保険,厚生年金保険,労災保険,雇用保険 交通費:全額支給 特記事項:【福利厚生】
・健康診断
・インフルエンザ予防接種
・書籍購入費負担
・カンファレンス参加費負担
・社内勉強会
・社内会食費用支援
・1on1
・フリードリンク
・モニター貸与
・自販機設置
【受動喫煙について】
屋内禁煙
【受動喫煙防止情報】 屋内受動喫煙対策:対策あり
|
こだわり条件 |
学歴不問 即日スタート 経験者優遇 駅から徒歩5分以内 10時以降出社OK 土日祝日休み 交通費支給 社会保険完備 育児支援制度 リモートワーク(在宅勤務)可 フレックスタイム制(コアタイムあり) 研修・勉強会充実 |