MonotaRO Tech Summer internship 2020 データサイエンスコース 参加レポート 2

参加するにあたって

私は普段大学院で自然言語処理の研究をしており、言語処理のアカデミックな面だけでなく、実際にビジネスの第一線でどのように利用されているのかに関心を抱いていました。また、専門分野の技術を活かしたサマーインターンシップに参加したいなと思い、「魔法のスプレッドシート」からモノタロウの 5Days Data Science インターンの募集要項を見つけて応募しました。

私は学部生のときに機械系の学科だったこともあり、研究室で歯車などの部品を注文する際にモノタロウのECサイトを利用していたので、少し馴染みがありました。

取り組んだタスク

レビュー文キーフレーズを取得するというタスクに取り組みました。

5日間の流れ

インターンシップの初日は人事の方から説明があり、午後以降は2人1組に分かれてメンターの社員さんの指導のもと、早速業務に取り組みました。

初日は、ACL(自然言語処理のトップカンファレンス)をメインに既存手法を精読しました。

2日目には調査した既存手法を実際に実装してその精度(キーフレーズの抽出結果)を手元で確認しました。その結果をもとに独自の改善案を考えます。

3日目、4日目は考えた独自の改善案をもとに実装しその精度の確認と考察を行いました。

最終日には取り組んだタスクについて発表する機会があります。ここでは5日日取り組んだタスクの概要、既存手法の紹介とその問題点、独自の提案手法の紹介とその結果、インターンシップを通して感じたことなどをメインに2人1組で発表しました。この場では、データサイエンスとエンジニア両方の他のインターン生の発表も聞く事ができるのがよかったです。

また、会社全体の会議やデータサイエンスグループ内の勉強会に参加させて頂いたり、3日目の夜の懇親会では社員さんとざっくばらんにお話できる機会もあったので、インターンシップを通してデータサイエンティストとして働く自分をイメージすることができました。

まとめ

データサイエンティストとしてのインターンシップは今回が初めてでした。

初日に取り組むタスクが決まって、それに関する関連分野の論文を調査するところから業務は始まり、実際に実装・改善をして、その内容を最終日に発表しました。

論文調査から実装という一つの成果物を生み出す段階まで5日間でやり遂げるのはなかなかハードでしたが、とても貴重な経験でした。また、インターンシップは現地開催ではなくオンライン開催ということで少し不安もあったのですが、メンターの社員の方はいつも優しくフォローしてくださるので、特に問題なく作業に取り組む事ができました。

5日間という短い期間でしたが社員の皆さん本当にありがとうございました。