PyCon JP 2022

A game can be thought of as a series of states. The characters in the game either interact with the scene or with each other. Even a small game has hundreds of states. We will discuss how to render these scenes and manage these interactions using three open-source projects - XState, PyScript and Atri.

Visualization / Games / Music

pyconjp_2

13:00

30min

[辞退 / Declined] Working with Rust and Python using PyO3

Quazi Nafiul Islam

このセッションは登壇者の都合でキャンセルされました。

This talk has been canceled due to speaker's reasons.

Rust has been taking the performance computing world by storm with its interesting approach to memory management. In this talk, we take a look at using Rust as a performance enhancing language and calling Rust inside Python using PyO3.

Related with another language

pyconjp_3

13:00

30min

業務改善の面白さ ~毎日更新されるビジュアルコンテンツの差分をわかりやすくするためのプロトタイプを作るまで~

中川万莉奈(AIIT 追川PBL)

課題の背景

日本経済新聞社では、日々報道機関としてニュースを配信している。その中でも定期的にデータを更新する「チャートで見る日本の接種状況　コロナワクチン」コンテンツがある。このコンテンツは特に人の健康や生命に関わる大事な情報であるため、データの間違いや表示の間違いは許されない。

課題

記者チームが公開されるデータに責任を持っている。
記者側がスプレッドシート上でデータを確認していたとしても、実際にWebページ上で正しく更新されているかは、いちいちページにアクセスして見ないと確認できない状態だった。

解決手段

そこで、ビジュアルリグレッションテストのように、何が画面に変更があればその差分をわかりやすく並べ表示することで、それが意図された変更なのかが誰でも判別することができる状態を目指せるのではないかと考えプロタイプを作ってみた。

詳解 print("Hello, world")

Rei Suyama

新しい世界に飛び込むときの定番 Hello, world 。
Python に出逢い学び始めたとき print("Hello, world") を実行したひとも多いのではないでしょうか。
このトークでは、Python に慣れた今だからこそ改めて print("Hello, world") を実行し、その裏側で起きていることを深掘りしていきます。

Python の仕組みやシステムプログラミングの世界に Hello, world しましょう！

Python core

pyconjp_4

13:50

30min

Pandas卒業？大規模データを様々なパッケージで高速処理してみる

fujine

Pandasは構造化・半構造化データを直観的に加工・解析できる優れたPythonパッケージであり、データ分析分野を中心に、初級者から上級者まで幅広く使われています。

しかし、Pandasはマルチコアや遅延処理をサポートしないため、大規模なデータほど十分なパフォーマンスが得られにくいです。1000万行を超えるデータでは特に顕著であり、「Pandas遅いなぁ」と感じた方も多いのではないでしょうか？

本トークでは、より高いパフォーマンスを目指しているDask、PySpark、Vaexなどのデータ処理パッケージを紹介し、内部アーキテクチャや特徴、実際の処理時間やメモリ使用量などを比較検証していきます。

「とりあえずPandasで。」というスタンスから一歩踏み出し、データ規模や加工・解析内容に適したパッケージを使い分けられるようになりましょう！

Pybind11を用いたPythonのC拡張の開発について、基本的な使い方から、 C 言語レベルおよびPythonレベルでのテストやDevOpsパイプラインの構築を含む、関連する課題と実践している解法を紹介する。

Tips of development with Python

皆さんはふだんPythonを書いているときにアスタリスク*をどれくらい使いますか？
「あんまり使わないかも（というかそもそもそんなに使えるものなんだっけ？）」という方、このトークはあなたのためのものです。
このトークでは、*にまつわるPythonの文法事項を整理します。
Pythonを書く上で*は頻出ではないのですが、このトークでの*との出逢いを頭の片隅に留めておくと、気持ちよく書ける瞬間が訪れますよ！（私は先日2つの辞書のマージが*でスッキリ書けました）🌟💫🌟💫

Tracking the invisible: Geoinformatics and Human Social Behavior

Violeta Sosa

We live in an era in which well-used information can improve our quality of life. Still, sometimes it can harm our privacy situations such as physical tracking. As more tools became available, more information about our physical bodies could be accessed. In this session, we will learn about skeleton tracking and have an approximation of the available technology, to analyse human group behaviour.

このセッションでは、イベント駆動アーキテクチャについて実用的なTipsを交えて解説していきます。普段は手続型のプログラミングに慣れている方が、設計パターンから非同期タスクの運用までを理解していただけるようお届けします。

Web programming

pyconjp_2

14:40

30min

Python ライブラリ開発における失敗談〜開発者に選ばれるライブラリを作るために必要なこと〜

池田大志

私は、これまで自然言語処理に関連する Python ライブラリをオープンソースのソフトウェアとして公開してきました。その中で、どうすればライブラリを開発者に利用してもらえるか、どのようなライブラリが開発者に必要とされるか、常に考えながら開発を続けてきました。

そこで、今後の Python ライブラリ開発の参考になることを目的とし、工夫してライブラリの利用者が増えたこと、逆に失敗して利用者を減らしてしまったことを経験談としてお伝えしたいと思います。

また、実際に開発者に利用されている Python ライブラリを、自然言語処理関連のライブラリを中心に調査し、開発者に選ばれるライブラリにはどのような特徴があるか分析した結果もあわせてお伝えしたいと思います。

資料：https://speakerdeck.com/taishii/pycon-jp-2022

Python/PyQtとQGISではじめる公共交通分析

Kanahiro Iguchi

PythonとQGIS（オープンソースのGISソフトウェア）を用いて、「GTFS」と呼ばれる公共交通機関の路線・時刻表データを容易に可視化するツール「GTFS-GO」を開発・公開しました。当初よりアップデートを重ね、「GTFSの可視化」だけではなく「運行頻度集計機能」や「GTFSデータリポジトリ（試験運用中）との連携機能」が追加され、GTFS活用の幅が大きく広がっています。
本トラックでは、「GTFS-GO」とその開発の背景を紹介します。

Python3.11新機能asyncio.TaskGroup()と2022年asyncioの"Hello-ish world"

Junya Fukuda

2022年10月にリリースされるPython 3.11にて「PEP 654 *Exception Groups and except*」がAccepted**され、asyncio.TaskGroup()が追加されます。これによりエクセプション、キャンセル処理が強化され、より柔軟にasyncioが進化します。

本トークではこのasyncio.taskgroupによって何ができるようになるのか、asyncioがどう変わるのか、お話ししたいと思います。

Pythonに上級テクニックは要らない（そして正しい付き合い方）

清原弘貴

Pythonのテクニックは何があるでしょうか？　ContextManager、デコレーター、継承、特殊メソッドなど色々な文法や知るべき技術があります。

ですがそれらを普段の開発でどれほど活用すべきでしょうか？
「新しく学んだので使ってみた技術が、後々のメンテナンス性を大きく下げていた」そんなことはよくあります。Pythonの文法や使える技術がそれぞれどういった場面に適しているか、むしろ使うべきでないかをお伝えします。
作りたいものの複雑さや、仕事とライブラリーのコードの違い、関わる人の人数などを念頭に説明します。

とくにこれから中堅になってくるPythonエンジニアが聴くべき（そして未来の失敗を避けるべき）トークになるでしょう。

Tips of development with Python

pyconjp_1

14:40

30min

[辞退 / Declined] Don’t let your data model `drift` away!

n4jp4y

Learn how model drifts in the production environment affects our machine learning models and how to track and assess them in Python so that the model remains relevant in production and makes fair and unbiased predictions over time.

15:30

休憩時間。

16:20

近年、様々な分野で使われるようになったWebRTCを使ってのクライアント・サーバ間のリアルタイム通信。
この技術はこれからのリアルタイム通信を利用したサービスに置いては必須の技術になりつつあります。
このトークでは、そんなWebRTCについて、FastAPIを利用してWebRTCサーバを簡易実装して、WebRTCの中身について実装とともに解説します。

Tips of development with Python

pyconjp_1

16:20

30min

Network Science with Python

Mridul Seth

Ever wondered about how to find bottlenecks in the electricity grid? Patient zero in a outbreak? Or recommending friends on a social network? This talk is for data scientists and other programmers who want to add another tool in their data science toolkit. We will discuss how tools like NetworkX in the Python ecosystem can be used to better understand and analyze network data.

Playwrightを使って簡単に自動テストしてみる

Takahiro Hama

PythonのWeb自動テストではSeleniumを使う方法が有名ですが、
作成・メンテナンスするのに、結構手間がかかります。

他の言語であれば、PupeteerやCypressという選択肢もありますが
できればPythonで実装したいと感じていました。

Playwrightは、TypeScriptで作成されたテスト自動化フレームワークで
多言語対応されており、Pythonでも利用できます。

このトークでは、Pythonで実装できるいくつかの自動化の方法と比較し、
Playwrightを使うことでより簡単に実装できることをお話します。

古くからあるパッケージングツールのsetuptoolsは今でもPEPへの追従などサポートされ続けています。
登場当初は多くの機能を持っていましたがそれらの機能はPEPでの議論などを通してwheelやpyproject.tomlのような標準フォーマットやpip,twineといった別のツールへと役割が分離されていきました。
setuptoolsが持っていた機能と現在の標準や別のツールとの比較を通してパッケージングツールの歴史を説明したいと思います。

実践：日本語文章生成　Transformersライブラリで学ぶ実装の守破離

石原祥太郎

私たちは日々、言語を喋る・書くといった文章を生み出す動作を当たり前のように実行しています。このような創造的な行為は人工知能が苦手とする領域だと議論されてきましたが、近年の研究成果に伴って実現可能な範囲が広がってきました。本講演では日本語の文章生成を題材に、基本的な処理の概要や、Pythonの自然言語処理ライブラリ「Transformers」を用いた実装、事業会社での実践事例や課題を紹介します。具体的には、最初に自然言語処理の急速な発展を下支えする機械学習の基本的な考え方を概観し、次に日本語を題材にした実装例を「守・破・離」の段階別に説明します。講師が所属する日本経済新聞社では大量の日本語のニュース記事を処理しており、文章生成技術の適用可能性も大きいです。実務での経験を基に、具体的な事例や直面する課題についても言及します。

Machine learning

pyconjp_5

17:10

30min

AST（Abstract Syntax Tree）に入門する

Masahiro Yasumoto

AST（Abstract Syntax Tree、抽象構文木）は、Pythonインタープリターがソースコードを解析した結果を木構造で保持したもので、これがさらにbytecodeに変換された後、実行されます。また、CPythonでは、astモジュールを使って、ASTの中身を覗いたり、ASTの中身を書き換えることができるようになっており、この機能は、testingフレームワークやlinterなどのライブラリの中で活用されています。
このセッションでは、ASTを初めて知る方に向けて、ASTの概要と、astモジュールの活用事例について紹介します。

Better project maintenance with static analysis

Tushar Sadhwani

We set up implicit or explicit rules in many projects. Where to create what kind of files? What's the naming convention? What's the API conventions?

Instead of keeping these rules in your head, in docs, etc. and checking them manually, what if you could write the rules as code?

With static analysis, you can automate the entire process. In this talk you'll learn how to do exactly that.

GeoDjango ORMと地理空間データの世界

阿部涼平

Webフレームワークとして世界中で使われているDjangoですが、そのDjangoには標準でGeoDjangoというモジュールが含まれており、サーバーサイドで地理空間データを扱う際に広く利用されています（公式ドキュメント）。GeoDjangoには特有のORMが用意されており、実際にSQLを書くことなく地理空間データの処理（空間演算）を行うことができます。しかし、現在GeoDjangoのORMに関するまとまった情報は少なく、GeoDjangoを利用していてもそれらの機能を生かしきれてないパターンもあるかと思います。そこで本セッションでは、GeoDjangoが持つ便利なORMの紹介、および実装プロセスを簡易な地図アプリケーションでのデータ可視化を交えつつお伝えします。

NLPを活用したオンボーディング改善とコールドスタート問題への対策

Takanobu Nozawa

現代において我々が使用している様々なサービスは、パーソナライズやレコメンデーションといった機能が当たり前の時代になっています。
レコメンデーションの課題として、行動履歴が十分にないユーザーに対してレコメンデーションすることが難しい（これをコールドスタート問題といいます）ということが挙げられ、さまざまな企業が工夫をしている状態です。

本トークでは、QAアプリ「ママリ」において、自然言語処理を利用したアプリチュートリアルの改善の裏側、および新規ユーザーにおけるコールドスタート問題に対してどのような対策を行っているのかについてご紹介します。

Jetson Nanoを用いたエッジAIの構築方法を紹介します。Jetson NanoはGPUを搭載した小型コンピュータです。画像認識や物体検知などAIを用いたリアルタイム処理が可能でコロナ禍の今、その活用の場は増えています。Jetson Nanoの開発に欠かせないJetPack SDKでは、エッジAI開発の助けとなるツールやPythonライブラリが豊富にそろっており、エンジニアも独自のアプリケーションを開発し世の中の課題を解決できるようになってきました。この発表ではエッジAIの構築におけるノウハウやエッジデバイスでアプリケーションを動かす上で経験した課題やその解決策を紹介します。

18:00

Day1のLTです。