新卒2年間の振り返り

5/23が新卒で入った会社の最終出社日でした。せっかくなので新卒時代の振り返りを行います。

目次

  • 新卒時の意思決定
  • 2年間で何をしたか
  • どんな経験を得たか
  • 入社してどうだったか
  • 次のキャリアについて

新卒時の意思決定

私は21年卒として就職活動を行い、最終的に某IT大企業 (以降A社と呼ぶ)に就職しました。 当時はデータサイエンス職を中心に新卒採用を受けていて、現職のみならずWeb系や研究開発職、受託データ分析の会社などから内定をいただいていました。

なぜA社を選んだかについてはここでは詳しく述べませんが、手を挙げれば挑戦させてもらえる環境がありそうであること、高校時代の友人が既にA社に入社していて内部の事情がある程度わかっていることなどから総合的に判断してA社に決めました。特にこれと言ってやりたい事業はなかったため、あえて多様な事業ドメインに関われる大企業に入社して、その後やりたいことを見つけていこうという考えでした。

2年間で何をしたか

私が配属されたのはコンピュータービジョンの研究開発の部署でした。(これはいわゆる配属ガチャです。)
研究開発といっても論文執筆をする人たちもいれば、論文執筆はぜず医療機関からデータをもらって解析するといった応用研究やPoCをするチームがありました。私は後者のプロジェクトに関わっていました。

詳細は述べれませんが私は2年で以下の分野の応用研究やPoCを経験しました。 具体的な分野は以下の通りです。

  • 医療画像解析
  • 3D物体検出
  • SLAM
  • 3次元再構成
  • 単眼深度推定

学生時代に統計学を専攻していて画像データを扱ったことのない自分にとっては結構ニッチな分野のPoCを任されましたが、自分が知らない新しい分野のリサーチを行い動くものを作る経験は楽しかったです。

どんな経験を得たか

PoCを一気通関で行う経験

PoCのテーマ決定はトップダウンでありふわっとしていてゴールが明確ではなくやりにくいことが多かったです。(例えば物体検出を例にあげると、物体検出という技術を使ったPoCを行えばよく、何の物体を検出するか、データとして何を使用するかは自分たちで決める必要がありました。)

上記の制約の中で、自分たちでPoCの詳細なゴールを定めて、そのゴールを達成すべきために必要な評価方法を定義して、その評価方法を満たすためにはどのような検証・データが必要か考えて、その検証項目を満たすべく過不足のないデータ収集を行い、データ収集ができるようなハードウェアを調査し必要なスペックのハードを購入し動作確認を行う、といったPoCの全ての工程に関われたことは大きな経験となりました。

また自分たちは企業の研究開発の部署であるためPoCの詳細なゴールを決定する際には、A社の事業に貢献できるか、その研究テーマはリソース(人、モノ、金)はどれくらい必要か、伸びしろはあるか、競合はどうかなどを常に問われていました。研究テーマを決定する上でここが非常に難しかったのですが、この経験は今後につながるものになると思っています。

コンピュータービジョンに関する知識と経験

学生時代からKaggleなどのデータ分析コンペに参加していましたが、以下の通りテーブルデータの経験しかありませんでした。

  • 称号: Novice
  • メダル: 銀メダル🥈 x1 (Riiid Answer Correctness Prediction)

しかし、2年間コンピュータービジョンの研究開発を行うことで、新たに4つの銀メダルと1つの銅メダルを獲得しKaggle Expertになることができました。

  • 1st and Future - Player Contact Detection
    • 銀メダル🥈 (24/939)
    • データ: 画像、テーブル
  • DFL - Bundesliga Data Shootout
    • 銀メダル🥈 (27/530)
    • データ: 動画
  • Image Matching Challenge 2022
    • 銀メダル🥈 (29/642)
    • タスク: 特徴点マッチング
  • H&M Personalized Fashion Recommendations
    • 銀メダル🥈 (133/2952)
    • データ: テーブル、画像、自然言語
    • タスク: 推薦

上記のようなKaggleの成績が残せたのは、もちろん業務を通しての成長もありますが、業務内での自己研鑽やマシンリソースの提供、インセンティブ制度といった会社のサポートがあってのことだと思っており非常に感謝しています。

その他

研究開発の部署に所属していたこともあり休日でも論文を読むことが習慣となり、2年間で多くの論文を読むことができました。 3D系のコンピュータービジョンの論文を読むことが多く、精読したものの一部については以下にまとめています。
https://www.notion.so/5dc244a8170249e3826915f129d304e4?v=c8fe06ecfce7480fb81f4ff349a8baf5

入社してどうだったか

入社前にやりたいことが明確ではなかった自分ですが、CVの研究開発に関われた2年間は非常に充実していたと思います。これは自分が新しい領域や技術に関われることにやりがいや楽しさを感じる性格であったからだと思います。 またCVが何もわからない自分に丁寧に教えてくださった部署の方々やプライベートを一緒に楽しめる同期など、人にも恵まれた2年間でした。

次のキャリアについて

広告系の会社でデータサイエンティストをやっていきます。想定される業務は以下2点です。

  • TVや広告に関連する何かしらの予測モデル開発
  • AIを用いたメディア・コンテンツ開発

前者はKaggleのテーブルタスクのようなもの、後者は生成AIやLLMを活用したメディア・コンテンツ開発だと理解しています。チームにはKagglerが複数人いて会社としてもKaggleの活動を一部サポートしていただけるようです。また書籍の執筆をされる方もいてアウトプットを推奨する文化があると聞いています。前職では対外的な発表やテックブログの執筆ができなかったため力を入れて頑張りたいことの1つです。

以上が簡単な新卒2年間の振り返りでした。所属は変わってもデータサイエンティストとしてやっていることは大きく変わらない認識です。引き続きよろしくお願いします。