• Home
  • Blog & News
  • ソニーのKaggle Master座談会 〜 ソニーのエンジニアとしてAIの最前線に挑み続ける

2024.02.01

interview

ソニーのKaggle Master座談会 〜 ソニーのエンジニアとしてAIの最前線に挑み続ける

登録者数1,600万人(※1)を超えるAIコンペティションプラットフォームである「Kaggle(カグル)」。ソニーのエンジニアたちは、データ分析やAI活用のスキルを磨くため、自主的にKaggleに参加しています。今回、ソニーグループのKaggle Master3名に、Kaggle参加の経緯や、コンペ活動で得た学び、さらに、その学びをソニーのAI領域にいかに役立てていこうとしているのかを語ってもらいました。 ※1 2024年1月時点

Research Area

Keyword

Share

〈写真左から〉宮谷 佳孝(ソニーセミコンダクタソリューションズ株式会社)、宮原 正典(ソニーグループ株式会社)、 小林 秀(ソニー株式会社)

スキルアップを模索するなかで、Kaggleと出会った

– まずKaggleに参加した経緯を、当時の仕事の状況を含めて教えてください。

宮谷:私は2018年にKaggleに参加しました。当時はデジタル一眼カメラα™(アルファ)のエンジニアで、「世界に先駆け、Deep Learningをカメラに導入しよう」と着想し、カメラ画質改善やオートフォーカス向けの新規アルゴリズムの開発などを手がけていました。ただその頃はDeep Learningの実社会への応用事例が報告され始め、新手法も日々発表されていたAIの発展期。現在のように 学習コンテンツが充実しておらず、私自身、この技術をいかにキャッチアップし、自分のスキルとして定着させていくのか、悩んでいました。そんなときAIを学ぶならKaggleが良いという評判を聞き、業務外の時間を使って Kaggleコンペに参加し始めました。

宮谷 佳孝
Kaggle参加当時は、ソニー株式会社 イメージング プロダクト&ソリューション デジタルイメージング本部に所属。現在はソニーセミコンダクタソリューションズ株式会社 に所属し、新規センシングイメージセンサ向けのAI開発部署のマネジメント職を務める。

小林:私もスキルアップを目的にKaggleに参加しました。その頃は半導体事業領域のエンジニアとして、人や手の関節位置を推定するAI技術や、それを活用した“ディスプレイを触らず操作する”タッチレスUIの開発にアサインされ、初めてAIの世界に足を踏み入れた時期でした。それらの技術開発はR&Dの有識者に協力を仰ぎながら、なんとか成し遂げたのですが、同時に「関節以外は推定できない、自分はAIをまだまだ理解していない」と実力不足を痛感。そこでAI関連の経験を一から積もうと、2021年からKaggleに参加しました。

小林 秀
Kaggle参加当時は、ソニーセミコンダクタソリューションズ株式会社イメージング&センシングエッジコア技術部門に所属。現在はソニー株式会社 システム・ソフトウェア技術センターに所属し、デジタル一眼カメラα™向けのAI技術および応用技術の開発に従事。

宮原さんもスキルアップが参加の目的だったのでしょうか。

宮原:実は仕事に役立てようという考えよりも、単純に面白そうだと思って2019年にKaggleに参加しました。私はデータ分析に関する研究開発から社会実装までを手がけるR&Dのチームに所属しています。昔から「機械学習やデータ分析などの技術を誰もが簡単に利用できるようにしたい」と考えていて、現在は予測分析ツールPrediction One のプロジェクトリーダーを担当しています。しかし、Kaggleに参加した当時は、業務では小規模な表形式データしか扱っていなかったため、より大規模な表形式データや、自然言語データ、画像データなども触ってみたいという好奇心からKaggleの門を叩きました。

宮原 正典
Kaggle参加当時から現在まで、ソニーグループ株式会社Technology Infrastructure Centerシステムプラットフォーム技術部門 データサイエンス応用開発部に所属。

楽しみながら学び、エンジニアとしての価値を高めていく

Kaggleではどのようなコンペ活動をされたのでしょうか。また、どのようにMasterに昇格したのかを教えてください。

宮谷:私は当時、画像を取り扱うエンジニアでしたので、初めは「馴染みがあり、良い成績が残せるのでは」という考えから、画像データを扱うコンペから参加し始めました。ただ途中から、AI全般の知見を広げていこうと、テーブルデータを扱うコンペ、数理最適化を目的としたコンペなどにも積極的にエントリーしていきました。
コンペを重ねるなかで得た自分の戦略は、とにかく情報のインプットを増やし、試行スピードを上げること。トップクラスのKagglerの解法を見ると、なぜこんなアイデアを思いつけるのか、自分との差に愕然とするのですが、実際に彼らの話を聞いてみると、何百回、何千回と試していたときに偶然見つけたんだ、と言っていて、「そうか、やるかやらないかだけの差なんだ」と気づいたのです。それから自分も少しでも可能性を感じれば、全部を試す。貪欲に学び、スキルを上げて、隙間時間を見つけてひたすら新しいアイデアを考えることを愚直に実行していきました。そのような過程の中で自然と成績も良くなり、Masterに昇格しました。

Kagglerの中では「Do Everything」という言葉がよく言われますが、まさにそれを実践されたのですね。他の皆さんはどのような活動をしていたのでしょうか。

小林:私の場合は当初、それほどAIの知識がなかったため、まず色々なコンペの解法の研究から始めました。その中には自分が仕事で取り組んでいるような課題のコンペもあり、想像もしないような多様なアプローチが豊富に存在していることに深い感銘を受けました。同時に、未知の領域への探究心が掻き立てられ、自分もリーダーボードに載りたいと強く思いました。
それからは、業務時間以外はすべてKaggleに費やす勢いで多くのコンペに参加。強いライバルと競うことで、自らの力を上げようと、難易度の高いコンペを選んで挑戦を繰り返していました。初めの一年間は思うような結果が出ませんでしたが、各コンペの終了後に自分のアプローチを見直し、上位入賞者の解法を学び、新しい視点や技術を体得し続けるなかで、次第にメダルを獲得できるようになり、Masterの称号を得ました。Masterという称号はもちろん、日々失敗しながらも成長していく過程が充実していて、楽しかったですね。

宮原:私は前述の通り「色々なデータにも触ってみたい」という思いで、業務や育児の合間を縫いながら、多様なコンペに多数エントリーしてきました。実際にコンペに参加したとき、Kaggleにはゲームとしての面白さが詰まっていると感じ、すぐに魅了されました。例えば、自分のパイプラインを少しずつ育成する楽しみや、リーダーボードの順位が大幅に上がったときの興奮、コンペ締め切り当日の朝9時前の緊張感、結果発表時のshake up※2 の衝撃など、ゲームをプレイするようにコンペに没頭していました。
ただ当時は仕事も面白く、かつ子どもの育児にも積極的に関わりたかったため、それらに支障がでないように趣味としてKaggleに取り組んでいました。具体的には仕事と育児を全力でやった後、自分へのご褒美としてコンペに参加していました。そのような状況で参加回数を重ね、毎回夢中でいくつもの解法を考えていく中で、いつの間にかMasterになっていたというのが実感です。仕事・育児・Kaggleの両立が厳しい場面もありましたが、「AIへの興味が全く尽きない」という自分の思いが継続の原動力になりました。

※2 Kaggleでは、コンペ期間中に公開されている評価データは一部であり、最終評価時に使用されるデータと異なるため、汎用性の高いモデル開発が求められる。そのため、コンペ終了時に順位が変動する可能性があり、shake upと呼ばれる。

皆さん「楽しみながら参加するうちに、自然にMasterに昇格していた」というのが共通していますね。ちなみに一番印象に残っているコンペや出来事は何でしょうか。

宮原:印象に残っているコンペは、ECサイト上のユーザの行動ログから、次の行動(click/cart/order)を予測する「OTTO – Multi-Objective Recommender System」 という推薦コンペです。対象のデータは、シンプルにtimestamp, user_id, item_id, action_typeのみですが、データ量が非常に大きく、180万アイテム、1200万ユーザ、2億2000万ログに上りました。何かに気づいた人が勝つコンペではなく、小さなアイデアを少しずつ積み上げて精度を上げていくコンペで、育成ゲームのような楽しみがありました。

宮谷:私は多種多様なコンペで、ソニー外のエンジニアとチームを組んで昼夜を問わずコミュニケーションを取りながら、課題に取り組んだことが思い出に残っています。同一の課題に挑む中で、ソニーの業務だけでは絶対知り得ない彼らの仕事の仕方、考え方に触れられたことで自分の視野が大きく広がりました。コンペで勝つために、当時のAI関連のトップ学会で発表されていて、スコアが上がる可能性がありそうな論文を多数読み込んで実験を繰り返しました。部活のような充実感があって、そのときのメンバーとは今でもエンジニア仲間として交流が続いています。

小林:私は、水中動画からヒトデを検出するコンペ「TensorFlow – Help Protect the Great Barrier Reef」です。これは、オーストラリアのグレートバリアリーフでヒトデが大量発生してサンゴ礁に影響を与えているという世界的な環境問題に対して、ヒトデを認識し、その数をチェックするという内容でした。実際の環境問題解決に貢献できるというやりがいとともに、AIの力で世の中をより良くしていくという、エンジニアの社会的役割を再確認させてくれたことが記憶に残っています。

試行錯誤の数が、エンジニアとしての自分の強みに

Kaggleに参加するなかで、どのような経験や学びを得たのでしょうか。また、その学びは現在の業務にどのように役立っているのか教えてください。

小林:ソニーでは世の中で誰もやったことがない開発プロジェクトが大多数なのですが、Kaggleで難易度の高いコンペに多く参加し、強いライバルと競い、自分なりの解法をだすという場数を踏んできたことで、どのような案件がきても「考え続ければ、答えに辿り着ける」という自信と技術が身につきました。例えば、 業務で新しい課題に直面した場合も、Kaggleでの経験をもとに、「こういう枠組みで、こういう学習のさせ方で、こういう評価の指標を組み立てればいい」とプロジェクトの筋道を立てられるなど、未知の問題にも立ち向かえる力がついたと感じています。

宮谷: 私もKaggleで色々なコンペに参加し、経験値を上げたことによって、データ分析の成否を「見極める力」が身につき、今のマネジメント業務において非常に役立っています。実際のAI開発の現場では「データはあるが、やってみないとわからない」といった場面が多々ありますが、自分は対象のデータを見ながら、「うまくいくか、うまくいかないか」と肌感覚である程度ジャッジできるようになりました。また、プロジェクトの進捗の確認をするときも「このケースなら、さらなる精度が狙えるはずだ」と指摘できるなど、より高い成果を狙えるようになりました。
また、私はKaggleにおいて、初期フェーズのExploratory Data Analysis(EDA:探索的データ分析)を重要視してきたのですが、このEDAは業務でも必須だと思っています。目の前のデータからすぐにモデルセットをつくるのではなく、課題の評価指標を確実に理解し、データを丸一日かけて眺めて何者なのかを知り、Validation※3 をしっかりと作り上げること。そのような初期フェーズの入念な準備こそ、データ分析の精度を高める土台になると思います。

※3 機械学習モデルの性能を評価するための手法

宮原:私もValidationの考え方や作り方が一番大事だと思っています。実際の開発現場では、事前評価で精度が高かったものが、本番環境で精度が全くでないという深刻な問題に遭遇することがありますが、Validationによって、そのような状況を防ぐことができます。Kaggleでは「メダルが取れなかった」で済みますが、実務では大損害につながってしまいます。だからこそ、これまでのKaggleでValidationの切り方を何度も失敗しながらも、精度を上げる勘所を体得できたことは得難い経験になっています。

ソニーの幅広い事業領域をいかし、新たな価値創造へ

Kaggleで得た学びやスキルをいかして、今後、ソニーのAI領域にどのように貢献していきたいと考えていますか。

小林:ソニーは、エレクトロニクス、エンタメテインメント、半導体、金融など幅広い事業領域を擁し、現在、グループ各社でAI技術の開発・導入に取り組んでいます。それら各領域で得た知見をグループ各社の枠を超えて共有していくことで、ソニーグループならではの新しいユーザー体験を提供し続けることができると考えています。そうした体験の創出に、Kaggleの多様なコンペで得た自分の経験やスキルをいかせればと思います。

宮原:私もソニーグループの事業領域の幅広さは無二の魅力だと思っています。実は私が担当するPrediction Oneも実際にグループ各社の方に使用してもらって、フィードバックをもらい、改善を何度も繰り返すことで、予測精度を磨き上げ、新たなツールのユーザ体験を創出していきました。

宮谷:昨今、機械学習のモデル開発やデータ分析そのものは大手IT企業をはじめ、他社でも多く手がけています。そのような中、データ分析のインプット・アウトプットにおいて、ソニーには強みがあると考えています。インプットについては、幅広い事業領域から得られる多種多様なデータに加え、半導体事業領域を擁し、新しいセンシングデバイスを生み出せるため、データ分析に最適なセンシングデータそのものを取得することができます。
一方、アウトプットにおいても、例えば、テレビで得たデータを保険商品の開発に使用するなど出口も色々と考えられます。私自身、ソニーグループ全体を俯瞰しながら、現在の業務である新規センシングイメージセンサのAI技術開発に取り組んでいくことを心がけています。

最後に、Kagglerの方を含め、読者へメッセージをお願いします。

宮谷:私が所属する半導体事業領域では、センシングイメージセンサの新しい用途の開拓がますます重要になり、PDCAを素早く回し、検討のスピードを上げていくことが求められています。私の場合、そのために必要なスキルはKaggleで全て培ったといっても過言ではありません。ぜひ、Kagglerの方にソニーの半導体事業領域について興味を持ってもらいたいと思っています。

宮原:ソニーの研究開発部門は、最先端の技術を研究開発しつつ、それを実際に世の中に出してユーザのフィードバックを得て、泥臭くも改善を繰り返す所までを全部をやり切れる場所です。さらに、ソニーグループ内にはあらゆる分野の専門家が集まっていて、かつ、幅広い事業領域から得られる様々なデータを活用できます。Kaggleで獲得したスキルを役立てる場もたくさんあります。

小林:新しいことに挑戦する意欲を持ち、互いに学び合える人々にとって、ソニーは最適な場所だと思います。自分の専門分野だけでなく、他の領域にも興味を持ち、問題解決に取り組むことができる仲間とともに、共に学び、共に成長しながら、未知の問題に挑戦していきたい。 それが社会課題の解決に繋がり、世界への貢献になるはずだと信じています。

Share

この記事をシェアする