PyCon APAC 2023

池田 大志

自然言語処理に関連するソフトウェアをオープンソースで開発しています!

アカウント
- GitHub: https://github.com/taishi-i
- Twitter: https://twitter.com/taishinlp
- SpeakerDeck: https://speakerdeck.com/taishii

過去の PyCon JP 発表経験
- PyCon JP 2018 - NLP(自然言語処理)初心者のための単語分割/品詞タグ付けツールの紹介
- PyCon JP 2019 - Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜
- PyCon JP 2020 - 最先端自然言語処理ライブラリの最適な選択と有用な利用方法
- PyCon JP 2022 - Python ライブラリ開発における失敗談 〜開発者に選ばれるライブラリを作るために必要なこと〜


Session

10-28
14:20
15min
情報収集を効率化する自然言語処理の活用方法 - PythonではじめるAwesomeリポジトリの作り方
池田 大志

新しい技術情報が毎日のように出現する昨今、これらの情報を追いかけることは時間や体力を消耗します。しかし自然言語処理の活用により、この問題を解決できます。インターネットから情報を自動収集し、その情報を分類、必要に応じて翻訳します。そしてその結果を質問応答モデルに入力することで、自分の関心に合った情報を抽出することができます。これらの機能は全てオープンソースのPythonライブラリを利用することで実現可能です。

私自身もChatGPTや日本語NLPに関する情報を自動収集し、その結果をAwesomeリポジトリとして作成し、GitHub上で公開しています。そこでユーザーからの意見を参考にした情報の効率的な整理や掲載方法をTipsとして共有します。このトークに参加することで「自動的に情報が集まるAwesomeリポジトリの作り方」を学び、さらに自然言語処理に関する知識も身につけることができます。

Machine learning
track 5