DeNAの「人」と「働き方」の " 今 "を届ける。

プロ野球の実データをAIで分析! なぜDeNAのサマーインターンは現役アナリストも驚く成果を出せるのか?

2019.04.04

「インターン期間中に何を目指すのか」テーマ自体もインターン生自らが決める。

自律的な成長環境に身を置けるのがDeNAのサマーインターンです。

2018年のサマーインターンに参加した筑波大・横尾 修平(よこお しゅうへい)氏が取り組んだのは「横浜DeNAベイスターズのチーム強化のためのAIデータ活用」。

最終的に横尾さんが発表した成果は、ベイスターズのアナリストたちも驚くほどのもの。 なぜ、DeNAのサマーインターンはここまで学生が成果を出せる環境なのでしょうか。

インターン中にメンターを務めたAIシステム部エンジニアの大西 克典(おおにし かつのり)との対談で、振り返ってもらいました。

筑波大学大学院 システム情報工学研究科

横尾 修平(よこお しゅうへい)氏

長野高専を卒業後、筑波大学へと進学し、現在は同大学院の修士課程に所属。2020年4月に新卒でDeNAに入社予定。高専では数値計算に関する研究、大学では画像認識をはじめとしたComputer Visionに関する研究に従事。Kaggleや国内コンテストなどで複数入賞経験あり。

株式会社ディー・エヌ・エー AI本部AIシステム部AI研究開発第一グループ

大西 克典(おおにし かつのり)

東京大学大学院にて修士取得後、2017年10月に新卒でDeNAに入社。AI研究開発エンジニアとして活躍する。大学時代はComputer Visionの中でも主に動画関係の研究に従事した。主著論文をCVPR2016、ACMMM2016、AAAI2018で発表。

「Kaggleでは触れられない実データ」を扱える

――横尾さんは2018年のサマーインターンで「横浜DeNAベイスターズのチーム強化のためのデータ分析、AI活用」を担当したそうですね。

▲ 筑波大学 システム情報工学研究科学部 横尾 修平(よこお しゅうへい)氏
▲ 筑波大学大学院 システム情報工学研究科 横尾 修平(よこお しゅうへい)氏

横尾

そうなんです。

楽しかったですね。大学でAIとCV(※1)を学んでいるうえ、小学生時代から野球ファンである私にとっては最高の機会でした。

※1……コンピュータービジョン。コンピュータで画像や動画を解析し、必要な情報を取り出す技術。

――あらためてメンターを務めた大西さんから、業務の概要を教えてもらえますか?

株式会社ディー・エヌ・エー AI本部AIシステム部AI研究開発第一グループ 大西 克典(おおにし かつのり)
▲ 株式会社ディー・エヌ・エー AI本部AIシステム部AI研究開発第一グループ 大西 克典(おおにし かつのり)

大西

「横浜DeNAベイスターズのチーム強化を、CVとDS(※2)を活用したデータ分析によって成し遂げること」。

それが大きなミッションです。

私が所属するAIシステム部は横断的な組織。

各事業がよりドライブできる手助けとなるべく、AI技術を活かし精緻な分析を行っているんですが、私が今担当しているのが横浜DeNAベイスターズ、というわけです。

※2……データサイエンス。データに関する研究を行う学問。

――横尾さんには具体的にどんな仕事をお願いしたのでしょう?

大西

「投手と相手打者の相性を解析する」というものですね。

――それはもし良い出来ならば、ラミレス監督などの監督・コーチ陣が、打順や選手交代の戦略の参考に使ってもらえる可能性もある?

大西

そうです。

「トラックマンデータ」というセンサーで、投打の弾道を計測したデータ、試合結果の詳細データ、さらに試合映像のデータをかけあわせ解析します。

これらデータの精度をAIを活用して検証。

クラスタリングを活用した打者モデルの作成をお願いしました。

――では、チームや選手の貴重な実データを直接触れる機会があった?

横尾

はい。実はそれこそがDeNAでのインターンを選んだ理由でもあったんですよ。

――というのは?

横尾

私は「実データ」を扱える仕事に携わりたいと思っていましたので。

Kaggle(※3)でいろんなデータを扱った経験はありますが、触れられるのは一般公開されているデータだけ。

プロ野球の実データを扱える、というのはとても貴重な経験です。

※3……データサイエンティストたちが集い、企業や研究者が投稿したデータに対しての最適モデルを競い合うプラットフォーム。

――いち野球ファンとしても、選手の方々の細かなデータや弾道データに触れられるのは楽しそうですね。

横尾

興奮しましたね(笑)。

普段見ることができないようなデータを触って、プロチームの勝利に貢献できる。すごくやりがいがあるし、得難い経験だなと感じました。

大西

とても気持ちがわかります。私自身も大の野球ファン。

そもそも私はCVを研究していて、そのうえで野球……というよりもベイスターズファンだったんです。

なので、今はまさに理想的な仕事環境。だからこそDeNAに入った面がありますからね。

――へえ! ところで、横尾さんはどちらの球団のファンなんですか?

横尾

えーと……、実はベイスターズではなく他球団のファンなんです(小声)。

▲ 筑波大学 システム情報工学研究科学部 横尾 修平(よこお しゅうへい)さん
▲ 2人とも野球好きだが、違いがあるもよう。

一同:(笑)

「何を目指すか」テーマからインターン生が決める

――インターンで実際のビジネスの現場に身をおいて、戸惑うことはありましたか?

横尾

データ分析や解析の面では、ほとんどありませんでした。業務そのものはKaggleに慣れている人ならば、あまり違和感はないかなと。

また「実データはKaggleで使うデータと比べると欠損が多く不完全である」とは聞いていたのでその点も戸惑うことはありませんでした。

大西

むしろ実作業に入る前の「テーマ決め」がけっこう大変だったんじゃない?

――テーマ決めとは?

大西

「インターン期間中に何を目指すのか」まずテーマ設定からする必要があるんです。

目的はチーム力強化ですが「あらかじめ正解が決まっていてそこを目指す」というタスクではないですからね。

打者のフォーム、投手のボール、守備、走塁、それぞれの動画データ……。

データは多種多様にありますが「それらをどのようにかけ合わせ、学習させて、どのような結果が予測できるか」を考える必要がある。

――最初からゴール設定があるKaggleとは違うと。

横尾

確かに、そこは少し戸惑いました。

「この課題が解決できたら面白いはず」「貢献できるのでは?」とゴールの仮説を立てることからやりますからね。

それは難しかったですが、面白さでもありましたね。

大西

大学の関係で横尾くんはインターン期間を1.5ヶ月しかとれなかったしね。短い中でしっかりと成果が見えるテーマを決めるのは悩んだよね。

横尾

最終的には既存のセイバーメトリクスの知見もベースとして活用しつつ、ユニークな予測モデルができたのかなと。

あとは私以外に、Kaggleでゴールドメダルを2つとった経験がある人と、10年来のベイスターズファンのエンジニアという2名がいたので、各々の強みを活かしあってテーマ設定、データ分析ができましたね。

ベイスターズのアナリストに成果をプレゼン

――大西さんは、横尾さんの仕事ぶりをどう見ていました?

向かい合わせ

大西

横尾さん含めインターン生3人が本当に優秀で、正直驚きましたよ。

いわゆる「技術的に優れている」というだけではなく「ベイスターズの現場でどう使われるか」までリアルにストーリーを組み立ててくれた。

あとは作業に迷ったら、すぐ相談にきてくれるのも、助かりましたね。

横尾

そこは大西さんがオープンに「なんでも聞いてね」と言ってくださったおかげですよ。

――最終的に、横尾さんがベイスターズのアナリストにその成果をプレゼンしたんですよね?

横尾

そうなんです。

横浜のベイスターズオフィスにうかがって、大西さんと発表しました。

緊張しましたが、興味を持ってもらえた実感もあって。

大西

いや、それが当日ざわついたんですよ。

――ざわついた?

大西

横尾さんの発表が「インターン生が1.5ヶ月で出した成果」と思えないほどの内容だったので(笑)。

ベイスターズ側の予想を一段も二段も上回るものだったので「おお、すごい!」というより「え? ここまでできちゃうの?」という感じで、ざわざわして。

横尾

本当ですか(笑)?

大西

本当、本当。

ベイスターズのアナリスト部隊を統括している部長に呼ばれて「DeNAのインターンって、毎年こんなにレベル高いの?」と囁かれたくらいです。

そのときは「今年は特別だと思います」と答えましたが、毎年、本当にレベルは高いんですよね。

――横尾さんがインターンで出した成果を元に継続して研究が進んでいるそうですね?

横尾

これも嬉しいことです。

大西

極めて実践的なデータ分析ができそうなので、研究継続を決めました。こちらこそお願いした甲斐がありました。

メジャーリーグでもまだ進んでいない領域

――そもそもサマーインターンに参加したきっかけは何だったんですか?

横尾 修平(よこお しゅうへい)さん

横尾

先ほども言いましたが、元々野球好きだったんですね。

そしてセイバーメトリクスを使って弱小球団だったアスレチックスをたてなおす映画『マネーボール』(※4)を観て「データ分析でチームの勝利を手がける仕事をしてみたい」とずっと憧れていて。

※4……ブラッド・ピッド主演の球団を運営するゼネラル・マネージャーが、弱小貧乏球団を強くするため、野球界に革命を起こす様子を描いた映画。

――AIなどを学んだのも、最初から「野球のチーム分析に活かせたら」という思いがあった?

横尾

いえ。AIを学び始めたのは野球は関係ないですね。ただ、DeNAに興味を持ったのはシンプルに「野球のデータを触りたい」と思っていたからというのはあります。だからインターンとしてそれに関われそうなDeNAへ。

大西

『ビッグデータ・ベースボール』(※5)は読んだ?

横尾

読みました。あれも良かったですよね。

大西

うん。

私の場合はそっちにハマった。

面白かったと同時に「メジャーリーグのデータ分析といってもまだこのレベルなんだな」という感じがあって。機械学習でまだまだブラッシュアップできる。「自分たちが活躍できる領域があるじゃん!」という興奮があって、それができそうなDeNAを選んだんです。

※5……トラヴィス・ソーチック他著『ビッグデータ・ベースボール 20年連続負け越し球団ピッツバーグ・パイレーツを甦らせた数学の魔法』

――あ、メジャーリーグでも機械学習の領域はそこまで進んでないんですか?

大西

意外とそうなんです。

だからDeNAでこの領域に携われることは「世界的な先駆者」にもなりえる。少なくとも私たちは、日々そういう気持ちで仕事していますね。

横尾

確かに。インターンでありながらも、現場に飛び込めるのは本当に魅力的でしたね。

社員の方々はとても気さくに話しかけてくれましたし、いつも社内のあちこちでディスカッションしていました。

大西

割とラフなんだよね。

横尾

いい意味で研究室の延長線上にある雰囲気で、とても仕事しやすかったですね。

――サマーインターンを通して、変わったな感じることはありますか?

横尾

研究や仕事に対するモチベーションがあがったことですね。

先に述べたようにDeNAの方々はみなフランクでワイワイと議論しているのですが、それが著名なKaggle Masterだったり、ものすごいエンジニアの方だったりする。

大西

Kagglerの人たちはとくにワイワイしているよね(笑)。

横尾

ええ。

また社内の勉強会なども多い。

自分の先を走る優秀な方々に気負いなく接することができて、ネット上には載っていないような知見やノウハウを、様々な機会で得られる。

とても意欲が高まりましたね。

――もっとも、横尾さんも2020年の4月からはDeNAの一員となるわけですよね?

横尾

はい。

新卒でDeNAに入社することが決まりました。

野球の分析ができるチャンスがあることも大きかったですね。

ただ、自分はけっこう幅広く興味を持つタイプ。

なので仮に将来、興味の対象が広がったときでも幅広く業務を手がけるDeNAなら何かしら自分のやりたいことが見つかるだろうなと考えたことが入社の決め手でしたね。

大西

ひとまず私たちの分析で、ベイスターズの優勝に貢献できたらいいですね!

メンターとインターン生
※本記事掲載の情報は、公開日時点のものです。

執筆: 箱田 高樹  編集:榮田 佳織・栗原 ひろみ 撮影:小堀 将生

open menu