PyCon JP 2022

石原祥太郎

日本経済新聞社の研究開発部署「日経イノベーション・ラボ」で、主任研究員としてデータ分析・サービス開発に従事。国内外の機械学習コンテストで入賞経験を持ち、入門書『PythonではじめるKaggleスタートブック』(講談社)の執筆や、勉強会の主催・登壇など、積極的な情報発信にも努めている。2020年、国際ニュースメディア協会の若手表彰「30 Under 30 Awards and Grand Prize」でアジア太平洋部門の最優秀賞を受賞。


Session

10/14
16:20
30min
実践:日本語文章生成 Transformersライブラリで学ぶ実装の守破離
石原祥太郎

私たちは日々、言語を喋る・書くといった文章を生み出す動作を当たり前のように実行しています。このような創造的な行為は人工知能が苦手とする領域だと議論されてきましたが、近年の研究成果に伴って実現可能な範囲が広がってきました。本講演では日本語の文章生成を題材に、基本的な処理の概要や、Pythonの自然言語処理ライブラリ「Transformers」を用いた実装、事業会社での実践事例や課題を紹介します。具体的には、最初に自然言語処理の急速な発展を下支えする機械学習の基本的な考え方を概観し、次に日本語を題材にした実装例を「守・破・離」の段階別に説明します。講師が所属する日本経済新聞社では大量の日本語のニュース記事を処理しており、文章生成技術の適用可能性も大きいです。実務での経験を基に、具体的な事例や直面する課題についても言及します。

Machine learning
pyconjp_5