認識の様式

ここでは、文章には「自然な単位」が存在することを示します。 言語は現実を記号化したものなので、現実側に自然な単位が存在します。 正確には人間が現実を認識する際に、ある一定の区切りに従って居るということです。

現実の認識

下の画像を見てみてください。まずは何も先入観なしで眺めてみてください。

現実のイラスト

何に注目しましたか?犬、ベンチ(に座る猫)、笑いながら走る子どもたち、遊具、日光、木、公園、花々、などでしょうか? この時点で既に「自然な単位」で現実を眺めていることになります。

自然な単位(現実側) - モノという単位

上に出てくるモノ、すでにモノと言っちゃっていますが、そういう単位で人間は現実を捉えます。それ以外の単位では見えないのではないかと。例えばモノ以外だと動作もあるかと思います。上の画像だと、「犬が走っている」とか「花が咲いている」、とかです。 でもこれらも「走る犬」、「咲いている花」、「犬が走っている(という様子)」、「花が咲いている(という様子)」といった具合に、モノ単位で考えることが出来ますし、心の動きを観察するとそんな気がします。犬にフォーカスすると「走る犬」、その周りのぼんやりとしたものは「様子」といった具合に、です。 以降は、このモノ単位で見るのが普通という意味で「自然な単位」と表現しておきます。

自然な単位(言語側) - 名詞句という単位

前回、言語は現実を記号化したものという話をしました。現実側に「自然な単位」があるとなると、言語側にも自然な単位があると考えるのが自然です。 文章だとモノは名詞に相当します(正確には「名詞句」(※、助詞が付くとかそういう話を書く))。 いくつか具体例を見てみます。

具体例 - 自然な単位(言語側)

ハイパーテキストリンク

現実のイラスト

インターネットでよく見る「リンク」(青い文字の部分)ですが、よく観察すると殆どは自然な単位(モノ単位)になっています。 試しに Wikiepediaへのリンクを貼っておきます。
リンクは人間が手で設定すると思うのですが、その際に認識の様式(モノ単位で考える)が現れた結果だと推察できます。Wikipediaのような文体がしっかりしている文章の場合は特にそうです。

注意書き

以下のような注意書きは店の張り紙やテレビのニュースで散見されます。 少し工夫すると見やすくなります。ボタンを押してみてください。
ギミックボタン

1. 原文そのまま

〇〇に関しての告知

〇〇県内指定の四箇所の一つとして当施設内の●●が設定されているようですが、この件について関連会社からの申請を受けていません。

故に、無料での入場は、許可しておりません。

アイテム入手目的のみの、無断入場および返金等へのお申し出には応じません。

以上、よろしくお願い致します。

2. 自然な単位(モノ単位)

〇〇に関しての告知

〇〇県内指定の四箇所の一つとして当施設内の●●が設定されているようですが、この件について関連会社からの申請を受けていません。

故に、無料での入場は、許可しておりません。

アイテム入手目的のみの、無断入場および返金等へのお申し出には応じません。

以上、よろしくお願い致します。



「自然な単位」にとどめて赤色強調しています。もちろん「設定されている」、「受けている」、「許可していない」、「応じない」、といった部分の情報が落ちていますが、その代わりに重要な各パーツをモノとして認識できるメリットを享受できます。また統一感もあります。

公園の画像

せっかくなので、先ほどの画像を言語化したものも観察します(画像も再掲します)。

現実のイラスト

1. 原文

日差しが差し込む明るく温かな昼下がりの公園です。 緑豊かな木々が公園全体を取り囲み、爽やかな風が木々の葉を揺らしています。 子供たちは、カラフルな服を着ており、楽しそうな笑い声が響いています。 元気よく走り回る犬は、見る人に元気を与えます。

ベンチに座っている野良猫は落ち着いた様子で、周囲の喧騒を静かに観察しています。 猫の目は半分閉じられており、リラックスした姿勢です。 公園内には色とりどりの花が咲き乱れ、その美しさがシーンに華やかさを加えています。 遊具もカラフルで、子供たちの遊び場として賑わっています。

2. 自然な単位(モノ単位)

日差しが差し込む明るく温かな昼下がりの公園です。 緑豊かな木々公園全体を取り囲み、爽やかな風木々の葉を揺らしています。 子供たちは、カラフルな服を着ており、楽しそうな笑い声が響いています。 元気よく走り回る犬は、見る人元気を与えます。

ベンチに座っている野良猫落ち着いた様子で、周囲の喧騒を静かに観察しています。 猫の目は半分閉じられており、リラックスした姿勢です。 公園内には色とりどりの花が咲き乱れ、その美しさシーン華やかさを加えています。 遊具もカラフルで、子供たちの遊び場として賑わっています。



これが普段、読んでいる文章だと思います。 次に自然な単位をボールド強調します。 次のボタンを押してみてください。

ギミックボタン

サラッと読む場合はボールド強調がない方が良い、もちろんそういう局面はあります。しかし、詳細をじっくりと把握しながら読むとなると、ボールド強調が合ったほうがイメージしやすく頭に入りやすいと思います。更にいうとなんとなく視野の広がりを感じませんか?ボールド部分は一つのモノ、というある意味で圧縮がなされているので、文章全体の構造がシンプルになります。

まとめ

今回の主張はシンプルです。ヒトは現実を「モノ単位」という自然な単位で切り分けて認識します。言語は現実を記号化したものなので同様の自然な単位が存在します。その自然な単位は無意識に反映(ハイパーテキストの例)されることもありますし、自然な単位で部分的に強調すると見やすくなったり(注意書きの例)、網羅的に強調すると視野が広がります(画像の説明文の例)。

予告

この自然な単位の強調はそれだけでは終わらないです。前回説明した「多色ハイライト」と連携することで真の姿を明らかにします。これはハイライト側から見ても同様です。 効果としては主観的には上のとおりです。
10% + 20% = 30%にはならないです。質的な転換が発生します(※)。 それでは、また次回もよろしくおねがいします。

(※)
私としては今回のものも20%に過ぎないので、私自身への説得力が小さく心苦しかったです。
効果の確認のために現象を素要素に分解する必要があるのでしょうが無いですが。
なのでアライメントに関してはすでに取り入れてしまっています。これで40%くらいには回復します。

余談 - 自然な単位の粒度

ここから本論とは関係ない余談です。が、結構大事なことを言っています。 まず第一に、モノ単位といっても複数の粒度がありうるという話です。

粒度(現実側)

まずは現実側を考えてみます。以下は塗り絵です。

粒度(現実・平均値)



塗り絵

この画像、どの粒度で見ているかの観点で自分自身を観察してみてください。 私の場合は、 辺りでしょうか。絵にマーキングするとこんな感じです。

塗り絵

個人差があるかもですがだいたいこれくらいだと思います。

粒度(現実・とても細かい)

一方でモノ単位はもっと細かくも広くも採れます。例えば、

塗り絵

長くなるのでこれくらいにしておきます。大事なのはこれらも「モノ」です。しかし普段はここまで細かく見ていないと思います。普段というのは正確ではなく、この絵全体を眺めるという視点では、です。犬と散歩している少女のみにフォーカスすると上の粒度で見るかも知れません。粒度は相対的なものです。

粒度(現実・とても広い)

ではこの絵全体を眺めるという観点で最も粒度が大きいのは何でしょうか?それは「この絵全体」です。

塗り絵

これについても相対的で、例えばこのような塗り絵がたくさん並んでいるという状況では「この絵」という単位は粒度として適切だと思われます。

粒度 - 言語側

言語は現実を記号化したものでした。同様に粒度があると考えるのが自然です。先程のカラー画像を文章にしたものを再度取り上げます。

粒度(言語・平均値)

復習ですが、先程は以下のような粒度でボールド強調していました。

自然な単位(平均的)

日差しが差し込む明るく温かな昼下がりの公園です。 緑豊かな木々公園全体を取り囲み、爽やかな風木々の葉を揺らしています。 子供たちは、カラフルな服を着ており、楽しそうな笑い声が響いています。 元気よく走り回る犬は、見る人元気を与えます。

ベンチに座っている野良猫落ち着いた様子で、周囲の喧騒を静かに観察しています。 猫の目は半分閉じられており、リラックスした姿勢です。 公園内には色とりどりの花が咲き乱れ、その美しさシーン華やかさを加えています。 遊具もカラフルで、子供たちの遊び場として賑わっています。



粒度(言語・とても細かい)

次に恐らく一番細かいであろう粒度でボールド強調してみます。辞書で名詞とされるものだけを抽出しています。 非常に細かいですが逆に目がいちいち止まって読みづらいです。これはしょうがない現象で、ボールドで強調するのはその部分をじっくり見てね、という意味なので当然読み止まります。やりすぎると止まりすぎるわけです。それでも現実の画像と同様に、この粒度が大事な文脈も有りえます。

自然な単位(とても細かい)

日差しが差し込む明るく温かな昼下がり公園です。 豊かな木々公園全体を取り囲み、爽やかな木々を揺らしています。 子供たちは、カラフルなを着ており、楽しそうな笑いが響いています。 元気よく走り回るは、見るに元気を与えます。

ベンチに座っている野良猫は落ち着いた様子で、周囲喧騒を静かに観察しています。 半分閉じられており、リラックスした姿勢です。 公園内にはとりどりのが咲き乱れ、その美しさシーン華やかさを加えています。 遊具もカラフルで、子供たちの遊びとして賑わっています。

粒度(言語・とても粗い)

最後に最も粗い粒度でボールド強調してみました。つまり文章全体ですね。これは塗り絵画像と同様です。

自然な単位(とても粗い)

日差しが差し込む明るく温かな昼下がりの公園です。 緑豊かな木々が公園全体を取り囲み、爽やかな風が木々の葉を揺らしています。 子供たちは、カラフルな服を着ており、楽しそうな笑い声が響いています。 元気よく走り回る犬は、見る人に元気を与えます。

ベンチに座っている野良猫は落ち着いた様子で、周囲の喧騒を静かに観察しています。 猫の目は半分閉じられており、リラックスした姿勢です。 公園内には色とりどりの花が咲き乱れ、その美しさがシーンに華やかさを加えています。 遊具もカラフルで、子供たちの遊び場として賑わっています。

圧縮

余談の余談で草ですが、言語は現実と違い言葉を圧縮することが出来ます。 例えば、 です。前者は辞書を見れば分かりますが、言葉の定義ぽいものがあるわけです。 例えば「玩具」であれば、「遊びのための道具」といった具合です。 「遊びのための道具」が関わる文脈で、「遊びのための道具」について触れることが多い場合はどうなりますか? 例えば学校運営にかかる費用、予算について議論している文脈です。いちいち「遊びのための道具」と書くのは長すぎます。そこで「玩具」という短い単語を使えば省スペースで話が進みます。辞書以外にも、契約書でも一方を「甲」、他方を「乙」と(仮の)定義をしてみたり、方程式であれば「リンゴの個数をx、値段をa」、「オレンジの個数をy、値段をb」、このとき全体の価格は「ax + by」などとやるわけです。もっと余談に入りますが、物事の抽象化がここには有ります。記号化は抽象化です。今回はリンゴ、オレンジでしたが、サブスクAの期間と料金、サブスクBの期間と料金、でも良いわけです。更にやっちゃうとf(a,b,x,y)といった4つの変数を持った関数として表現したり、f(x)といった具合に、ベクトルを入力としベクトルを出力する関数として表現できたりもします。 これが現実そのものではなく記号であるがゆえのメリットです。言語は神と言われたりしますが、まさにそのくらいの力があると思います。最初にこれを発明、発見した人は 抽象化は粒度の話とつながってきます。この粒度のコントロールが人の知的作業において非常に大事。 抽象化、汎化、知識の圧縮。例えば今世を席巻しているChatGPTなどはこちら側のプロンプトを(思いの外)抽象的に解釈して回答を返してきます。その筋の専門家からすると非常にインパクトがあるものでした。基本的にはユーザーが入力した文章およびChatGPT自身が返してきた回答に対して順を追って回答をしてきているというシンプルな原理で動いています(アテンションがどうとかの革新的な技術があったわけですが、ここではおいておきます)。私は専門家レベルではないですが、別の路線で抽象化を追究していましたが、ここまでやられちゃうとな、といった具合です。この抽象化はどこから来るか、それはChatGPTが言語ベースだからだと思っています。言語システムの側に既に理、抽象化があるわけです。

読書の観点

さて、上は複数ある自然な単位からどれを選択するか、の一般論でしたが読書の観点だともう少し考慮すべき内容が有ります。

ネガポジバランス

まず、ネガポジのバランスです。ボールド強調のことを指しています。先程の粒度の文章を再掲します。ボタンを押すと切り替わります。とても細かいのは20%/80%(ボールド / ノーマル)、平均は50%/50%、とても粗いは100%/0%です。100%になってくると効果はなくなってしまいますね。。逆に20%80%も効果が薄いです。50%/50%に近づけるのがバランスが良いです。
ギミックボタン
1.とても細かい(ボールド20%)

日差しが差し込む明るく温かな昼下がり公園です。 豊かな木々公園全体を取り囲み、爽やかな木々を揺らしています。 子供たちは、カラフルなを着ており、楽しそうな笑いが響いています。 元気よく走り回るは、見るに元気を与えます。

ベンチに座っている野良猫は落ち着いた様子で、周囲喧騒を静かに観察しています。 半分閉じられており、リラックスした姿勢です。 公園内にはとりどりのが咲き乱れ、その美しさシーン華やかさを加えています。 遊具もカラフルで、子供たちの遊びとして賑わっています。

2.平均的(ボールド50%)

日差しが差し込む明るく温かな昼下がりの公園です。 緑豊かな木々公園全体を取り囲み、爽やかな風木々の葉を揺らしています。 子供たちは、カラフルな服を着ており、楽しそうな笑い声が響いています。 元気よく走り回る犬は、見る人元気を与えます。

ベンチに座っている野良猫落ち着いた様子で、周囲の喧騒を静かに観察しています。 猫の目は半分閉じられており、リラックスした姿勢です。 公園内には色とりどりの花が咲き乱れ、その美しさシーン華やかさを加えています。 遊具もカラフルで、子供たちの遊び場として賑わっています。

3.とても粗い(ボールド100%)

日差しが差し込む明るく温かな昼下がりの公園です。 緑豊かな木々が公園全体を取り囲み、爽やかな風が木々の葉を揺らしています。 子供たちは、カラフルな服を着ており、楽しそうな笑い声が響いています。 元気よく走り回る犬は、見る人に元気を与えます。

ベンチに座っている野良猫は落ち着いた様子で、周囲の喧騒を静かに観察しています。 猫の目は半分閉じられており、リラックスした姿勢です。 公園内には色とりどりの花が咲き乱れ、その美しさがシーンに華やかさを加えています。 遊具もカラフルで、子供たちの遊び場として賑わっています。

意味論

一方で意味論も考える必要があります。つまり、意味として正しい塊になっているか。 どちらが正しいかは文脈に依ります。シンタックスだけでは解決しません。
解釈がブレる場合は多少長くなっても、 としてしまったほうが潔いという選択もあります。 上のボールド割合や下のFOVとトレードオフなので、このあたりは自由度があります。

FOV(視野)

人間は目を持っています。目で捉えられる面積には限界があります。 ボールド領域があまりに長すぎると一度に情報を捉えられず微妙です。 適度な長さである必要があります。 このFOV(Field Of View)は個人差だけでなく各国語によって異なってきます。
文字の違い - 表音 v.s. 表語
表音文字は英語などで使用されるラテン文字(ローマ字)などです。文字が音を表しています。日本語だとひらがな、カタカナがそれです。種類が少ない(ローマ字は大文字26文字・小文字26文字)ので憶えることが少ないです。一方で読む際にその組み合わせから情報を複合する際に負荷が発生します。組み合わせるので必然的に横方向に長く展開します。 表語文字は例えば漢字です(「表意文字」と言われますが正確には「表語文字」です)。音ではなく単語自体を文字が表しています。一文字だけでなく複合されることもあります(熟語)。表音文字と違って種類が多いので憶えることが多いです。その代わりに一度憶えてしまえば(つまり文字から単語を想像できれば)読書の際に情報の複合の負荷が小さくなります。ラテン文字等とは違い一文字に情報が圧縮されているので横方向に展開する量が小さいです。
単語区切りの存在 - スペースの有無
スペースが存在すると単語単位の認識が可能になります。英語は単語に分割するのが楽ですが、日本語はそれを一度分割する処理が発生します。この分割処理は読書時に負荷がかかる要因です。しかし単位面積あたりの情報圧縮、FOVを考えるとスペースは存在しないほうが良いです。また、上で粒度の話をしましたが細かすぎるのも必ずしもメリットにはなりません。事実、ドイツ語などの北欧語では2つの単語がしばしば結合して1つの単語が作られたります。これはもう少し長い粒度が自然という現れだと私は見ています。 読書時にその都度、自然な単位を流動的に示すにはスペースが存在しないほうが有利です。 FOVを小さくすることと、まっさらな気持ちで自然な単位を眺められる、という2点において、です。

冠詞の有無

冠詞については、Web上のハイパーテキストリンクを観察していると面白かったりします。上で、ハイパーテキストリンクで示されるものは「モノ単位」になっていると書きました。それでは冠詞がある言語の場合、冠詞込みで自然の単位と考えるか、冠詞なしか。一度観察してみてほしいです。

Wikiepediaへのリンク

冠詞は機能はおいておいてガワだけ見ると形容詞と同じ印象を持ちませんか? an apple, red apple、などです。 そして上は一貫性がない気がしています。これについては母語にしている人は全然違う見え方をしているかもですが。私はan appleだと思っていましたし、実はこの開発は英語からスタートしていてずっとこの路線で追っていました。しかしハイパーリンクを見ているとどうやら自然な単位は冠詞を含んでいないようです。何より、いちいち冠詞を含むと自然な単位の冒頭が情報量の小さい冠詞から始まってしまいます。私が冠詞を使わない日本語を母語とする日本人だからかも知れません。大事なものが冒頭に来るはずなので冠詞は英語文化圏の人からすると大事なものなのでしょう。しかし「自然な単位」をボールドで強調する、という観点だと冠詞は余計な要素に見えてしまいます。

網羅性の是非

自然な単位を全て示したほうが良いか、これも選択の余地があります。あまりにボールド部が増えすぎると逆に読みとどまりが多くなります。しかし結論としては私は網羅性を大事にしました。これはハイライトとの連携にふれる次回以降に詳細を述べます。ここではボールド強調としてよく目にするものとの比較を試みます。 G◯◯gle検索をした際に、ボールド体で文章が強調されていることがあります。あれは検索語に関連するという意味で重要な単語、検索対象領域(例えばグルメなら味に関わるとか駐車場がとか)において重要な単語をボールド強調しているように見えます。自然な単位を意識はしてなさそうですが、「モノ」を抽出してるぽい事例を発見したので、原文そのままと自然な単位強調を施したものを比較できるようにしました。ボタンを押すと切り替わります。

ギミックボタン

1. 原文そのまま(非網羅的、粒度が細かい)
Google
石鹸さえもない温泉ですが、お湯は最高です。昭和レトロな蛇口、シャワーも楽しんで。
Google
◯◯温泉銭湯なので、当然温泉入館料は安いが、泉質はヌルヌル系の美人の湯。
Google
露天風呂は、ややぬるめ温度登山後筋肉を労るのにありがたかったです。
2. 自然な単位(網羅的、粒度は適度)
Google
石鹸さえもない温泉ですが、お湯最高です。昭和レトロな蛇口シャワーも楽しんで。
Google
◯◯温泉の銭湯なので、当然温泉入館料は安いが、泉質ヌルヌル系の美人の湯
Google
露天風呂は、ややぬるめの温度登山後の筋肉を労るのにありがたかったです。


全てを網羅すると「それ以外」にノイズが入らないのが活きてきます。これは次回の多色ハイライトとの融合でもでてきます。ポジを網羅的に強調することで、裏、ネガ、が同時に映えるというボーナスが発生します。上で冠詞がを話題にしましたが、冠詞を抜くと余計なノイズが非ボールド側に乗ることになります。 この辺り、次回は人間の認識の本質、言葉の本質としっかり融合してカタルシスを憶える(私は憶えた)ので早く説明したいですね。鋭意製作中です。

余談2

自然な単位の計算は非常にテクニカルです。名詞を示すだけなら辞書を使ったわかち書きという比較的安価な処理で済みますが上の理由で粒度が細かすぎて良くないです。一方で自然な単位は複数存在します。理想的には構文木が得られると良いです。さらにそれだけでなく上のような複数の事情(バランス、FOV、意味論、フェールセーフな選択、などなど)が絡み合って職人的なパラメータ調整が必要です。そもそもFOVってなんだとか。物理的なFOVもありますし、文書としての内容のFOVもあります。とりあえず面倒くさいです。私も当初はCabochaやGinzaの依存解析の結果から適切な構文木を構築して、職人的なパラメータをシコシコ設定して自然な単位を得ていました。が、いまいち機械的でエグみが合ったのと、ちょっとした修正でいちいちparserや新規ルールを設定するのが面倒なのとで、最後はそれの結果をトレーニングデータにして、トランスフォーマで転移学習しました。タスクとしてはちょっとトリッキーなものを使っています。その結果、上記エグみが消えて集合知の観点でマイルドな結果が得られるようになりました。アテンション層で構文情報がバラバラではありますが見えているのは確かなので、それに適切なガイド(トレーニングデータ)を与えれば、まあうまくいく、だろうと。表現力が既にあるわけなので。実際にうまくいっています。HPのサンプルはそのモデルで出した結果です。機械学習でありがちなのは、前のタスクでのエラーをあとのタスクがうまく修正するには、両者を一気通貫でやるのが良いです。途中で事実として「確定」してしまうとその後でエラー修正する余地がないです。シュレーディンガーの猫を一度観測してしまうともつれ状態は解けてしまいます。そんあようなものです。ずれましたが、依存解析、からの自然な単位だと依存解析がミスしていると取り返しがつかないです。そして依存解析は外部のライブラリに頼っていたので私としては手を加えることが出来ません。なのでTransformerで一気通貫したほうが速いし精度も得られる。そんな理屈です。 まだこの先の話がありますが、そろそろ長くなってきたので改めてお話します。長々と読んでいただいてありがとうございます。

余談3

(※)Safari拡張は多色ハイライト && アライメントですが、30%程度ですね。外部サーバーとの通信がない、買い切り(約700円)、などのメリットはありますが、更にその上があります。今回の自然な単位の計算ですが、それなりに高度な機械学習技術が必要です(要GPUサーバー)。なのでスタンダロンでやるのは厳しいです。前処理をしたものをサービス提供者側で準備、という運用が資源にも優しいと見ています。例えば、

このサンプル、のようにです。

くるくる回っているやつをボタンで止めてみてください。 これはWikipediaのHPを前処理したものですが、特にソフトを入れなくても左下のボタンが有効になっています。電子教科書などのテキストを読ませる系のサービス事業者の方はこのような運用ができると思います。