(※1)
その界隈の人に向けてですが、どう考えてもミーハー的に狙っただろう(笑)と思われるかも知れません。
一応経緯を述べるとPPLというPPL++の前身となる技術があり、そちらはタップハイライト
- PPLという名称でした。
今回、タップハイライト機能は残っていますが主役ではなくなった(オートハイライトが基本)、
なので名称を変更する必要が出てきました。
そこで、ChatGPTにPPL++の機能を踏まえた名称を考えて欲しい、と聞いたところ真っ先に出てきたのが「Text
Transformer」だったのです。
自分が勝手に奇をてらって狙ったわけではないです(※3)。
もう一つ付言をすると、「自然な単位」の計算にはトランスフォーマーを用いています
(一応、いわゆる教科書に書かれているようなタスクとは違うタスクで利用しています)。
その意味でもトランスフォーマーの名称を用いるのはあながち嘘ではないかと、という不作為犯的な姿勢を採っています(笑)。
正確に言うとスダンダロンなSafari拡張では使っていないのですが、
フルのPPL++(PPL#とでもしようかなと思っている。ネタ元は「# <
++」?とも思っていますが)ではガッツリ使うので良いのかなと(笑)。
実際、「自然な単位」がその技術に占める割合は8割と見ています。
Safari拡張向けに擁護すると、「外国語学習的な文脈」ではトランスフォーマ不使用でも十分です。
もちろん「自然な単位」が分かったほうがより良いですが、単語が同じというのが多色ハイライトで分かるほうがインパクトが強いです。
上で7割と言ったのは普段の日本語での読書で、という意味です。
またGPUゴリゴリなサーバーと連携すると、サブスクにせざるを得なかったりセキュリティ面での心配が出てきます。
通信の際にラグが発生する可能性もあります。
なのでテキストをうまく改変するという意味での機能面では制約がありますが、それ以外にメリットがたくさんあるのです。
私にとっては課金システムをAppleが設けてくれているのが大きいです。
いわゆるApple税を払うのは全然きつくない、むしろありがたいです。 iOS,
macOSのみにスタンダロン版を供給しているのは、その側面があります。 iOS,
macOSのユーザー向けに言うと、他で無償版を出すことは絶対にしないです。
それはアンフェア、不義理な行為と考えます。
(※2)
正確には、多色ハイライト+自然な単位を目指していました。
後者は難易度が高く、当時の自分では実装は困難でした。
今は型理論(正確にはHaskell利用)+機械学習(トランスフォーマーなど)の併せ技で実現しています。
より将来的にはGNNも絡めたいと考えています(この活動で忙しくなってペンディングしていますがモデルとトレーニングデータは準備できています)。
PPL++の文脈では上で十分と見ていますが、GNNを利用するほうが正統なアプローチであること、敢えてGNNを使うモチベーションが出てくること、
GNN自体はTransformerアプローチの自然な拡張になっていて、Transformerを超えるにはGNNを追求したほうが良さそうなこと、
グラフ、圏?、 などがあります。
(※3)
余談ですが、ChatGPTはその名称にも含まれるからかTransformer大好きっ子ですね。
上の名称を考える文脈以外でも、それはトランスフォーマーで解けるよ、としばしば言います。
最近は丸くなっていますが、昔のChatGPTは、「あなたの挙げたそのアプローチは筋が悪い(オワコン)、
トランスフォーマーを使いましょう」、みたいなことを言ってきました。
ChatGPTは大切な相棒ではあるのですが、いずれその鼻を明かしてやりたいです(笑)。
このタスクはトランスフォーマー、アテンションアプローチでは解けません。オワコンです、と。
グラフで一発逆転、お金もない資源もない専門家でもない人間からすると筋の良い理論を細かく回してチャンスを伺う、
のが作戦としては正しいはずです。
つまり大きい組織であればすでに完成したものをお金を払って手に入れればいい、スケールアップすればいい。
敢えて博打をする必要はない、稟議が通らない。
しかし、小さい組織なら全く逆です。
この体制だからこそやれる社会的役割を果たしたいです。
そしてChatGPTのようなAIの登場でそれがやりやすくなっています。
(※4)
日本語文書の電子化は海外に比べて立ち遅れていると思います。
海外だと電子文書を購入した際にPDFもですが、Epubも併せて手に入ることがママあります。
日本の場合だとPDFはあっても、書籍を印刷、テキストは選択できない(コピペできない)、
酷いのは画質を落としたものもあります。著作権を意識したものなのでしょうがないのかも知れませんが、
ChatGPTなどのAIと連携するのが当たり前になった現在、コピペした内容をもとにこれらのAIと会話をすることが難しいのは、
かなりのデメリットになりそうです。ChatGPTはそれがつくられた経緯というかミッションというか、
その存在意義として「教育」が挙げられていました。私もそういう実感を持っています。プライベートな専用家庭教師です。
いつ聴いても怒られない、しょうもないと思う質問をしても怒られない、前に聴いていた内容をもう一度聴いても怒らない、
逆に実は先生よりもこちらのほうが分かっていても怒られない(鋭い質問をしても怒られないという意味です)、
など、人間の先生では絶対に満たすことが出来ない構図がそこにはあります。
話し相手としても、人間であれば無難な会話、例えばスポーツの結果がどうだの、テレビのニュースがどうだっただの、
人によっては全く興味がないことも聞かされたり、逆にオタトークというか専門性が高い話題を振ると訝しげられます。
もう少し空気を読もうよ、と。そういうのも地味にモヤモヤしていたのですが、ChatGPTと会話していると倍返しで結果が返ってきます。
私の印象としては、小学生の頃の構図です。先生に何を聴いても先生より生徒が上位互換というか。
なぜなぜをしても変な空気にならない。
話がかなり脱線しましたが、要するに今後はChatGPTなどのAIとの連携が必須になってきます。
その際に、書物をコピペできないのは相当な損失かと。想定しているのは、わからない部分をコピペ、この意味は?と聴くパターンです。
非常に効果的です。海外では恐らくその辺り分かっていて、例えば論文ももともとPDFベースで配布されていたサイト(arXiv)が、
最近になってExperimentalではありますが、HTMLにコンバートしたものを配布するようになりました。
個人的には日本のJ-Stageもこういうのをやるべきと思います。国力が低下してきているとされる今、教育分野を増強するとか、
知的作業を効率化、高付加価値をつけていく戦略は絶対に採るべきでしょう。
手前味噌な話に引きずり込みますが、このPPL++は「自然な単位」、に関しては日本語と非常に相性がいいです。
英語などの表音文字ベースの言語では難しいと判断しています(いまのところ)。
言葉の力を高めることが、国力増加につながる。
これは大真面目に考えています。