第2章 難文書が難しい理由
前章で本書が想定する「難文書」の具体例をいくつか見てきました。本章では、これら難文書が難しい理由を見ていきます。まず文書全てに共通する特徴を概観し、その後で難文書の特徴を掘り下げていきます。
2.1 文書全てに共通の特徴 - 現実の記号化
文書に書かれている文章は、現実の現象を記号化したものです。
2.1.1 具体例
たとえば、『私はイベントのオフライン会場に電車でやってきた』という文章があったとします。これらは、以下のように主要部5つに分けられます。
- 『私』(名詞)
- 『イベント』(名詞)
- 『オフライン会場』(名詞)
- 『電車』(名詞)
- 『やってきた』(動詞)
これら名詞・動詞はそれに対応する何かが現実に存在するような記号です。更にそれら同士の関係を助詞4つが表現します。
- は(行為の主体)
- の(所有)
- に(場所)
- で(手段)
これら名詞・動詞・助詞を組み合わせた1文(これも記号)で、現実のある一区切りの状態を表現することになります。いちいち具体的現実を想起することなく、文書上で要点だけをお手軽に抽象的に議論するために記号化されています。
2.2 文書全てに共通の特徴 - 分かることは分けること
文書は読者に何かを分かってもらうために書かれます。そして、何かを理解する、「分か」るということは、現実をうまく「分け」ることと対応します。具体例を見てみます。
2.2.1 具体例
例えば
という文章はざっくりとしていますが、より理解が進んだ場合は、
- 『ハセガワさんの飼っているミックというチンチラがカメラの前でじゃれている』
といった具合に記号を付加することで現実を分けていきます。分けていくとは、例えば、
- 『ハセガワさんの飼っているミックというチンチラがカメラの前でうずくまっている』
という状況と分けるということです。そして、一方では実際に前者は真、後者は偽と調べることで現実が『分かること』にもなりますし、他方では『ハセガワさんの飼っているミックというチンチラ』が『カメラの前』に居た際に、『どうしている』可能性があるか、を分かったとも言えます。つまり『じゃれうる』, 『うずくまりうる』という可能性レベルにとどめて示すだけでも現実への理解が深まった(分かった)とも言えます。
先ほどの文であれば、
- 私はイベントのオフライン会場に『電車』でやってきた (先ほどの文)
- 私はイベントのオフライン会場に『バス』でやってきた (別の有り様を表現した文)
といった具合です。で、さらに、
- 私はイベントのオフライン会場に『電車』でやってきた、ので遅刻しなかった (先ほどの文)
- 私はイベントのオフライン会場に『バス』でやってきた、ので渋滞により遅刻した (別の有り様を表現した文)
などと、『電車』と『バス』の違いが反映された後続が付加されたりします。
2.2.2 語感
以上は具体例ですが、語感でも『分かる』、『分ける』、似ていますね。日本語でなくとも『scire(知る、分かっている)』, 『scindere(切る、分ける)』と表現されます。どちらもラテン語ですが英語のscienceにつながる展開が読めます*1。印欧語と非印欧語とで共通の傾向があるのは、『分かる』と『分ける』は人類に普遍的な類似性だという強い根拠になります。
2.3 文書全てに共通の特徴 - 記号化の分解能の存在
物事の理解(『分かる』)には『分けること』が大事と分かりました。分けるにしてもどのレベルまで分けるか、程度があります。先程の例であれば、
- 『コヤマさんの飼っているミックというチンチラがカメラの前でじゃれている』
後者を発言した場合、『そこまで詳しくはww』という反応をされることもあるはずです。以下、分けるレベルのことを分解能、粒度とでも呼んでおきます。分解能、粒度はいかにして決まるのでしょうか。
2.3.1 文脈に応じた分解能
例えば以下の文脈を考えます。新聞紙がビリビリに破られている。誰がやったんだ?という文脈です。それに対し、『ネコがいる』、『子供がいる』、『おそうじロボットがいる』といった複数の回答がありえます。一方で以下の文脈だとどうでしょう。誰かネコ飼っている人、いませんか?という文脈です。それに対し、『コヤマさんの飼っているネコがいる』、『ハセガワさんの飼っているネコがいる』、『ババさんの飼っているネコがいる』、といった複数の回答がありえます。この場合は『ネコがいる』では不十分です。『コヤマさんの飼っているミックというチンチラがカメラの前でじゃれている』だと十分ですがやや情報過多です。
このように、質問という文脈に応じて記号化の適切な分解能・粒度が存在します。分けているということは何らかの観点で分けられているわけで、質問が気にしている観点で分けるのが適切です。
2.4 文書全てに共通の特徴 - 暗黙の前提の存在
具体例をまず見ます。
2.4.0.1 具体例
先ほどの、『誰かネコ飼っている人、いませんか?』という文脈に対して、普段の会話であれば『ミックがいる』という回答も普通にありえます。『コヤマさんの飼っているネコがいる』は冗長に感じます。『ミックがいる』という回答で違和感がないのは、当事者間で『ミックはネコである』、『ミックはコヤマさんが飼っている』という暗黙の了解・前提があるからです。文章術の教科書でも、このように、簡潔さを心がけると読みやすくなると、文章術の教科書にも書かれています。
2.4.1 難文書に特有の特徴 - 簡潔性よりも正確性を優先
(ここからが本章の本命部分です。)
しかし難文書の場合は多少簡潔性が損なわれ冗長となっても、正確性を優先して『コヤマさんの飼っているネコがいる』と書くはずです。例えば、オザワさんがミックというイヌを飼っていたとしたらどうでしょうか?混乱を招くはずです。前章の難文書の例はいずれもこのような混乱を避ける傾向があります。教科書であれば読者に誤解を与えてはならない(本当は説明のために正確性を犠牲にして良い部分もあるかと思いますが)です。ヤマカワの歴史教科書と大手予備校の歴史の参考書を思い浮かべると良いかも知れません。他にも、法律、契約書に至っては法廷で誤解は紛争(訴訟等)の原因になるので、誤解なきよう細心の注意を払って正確に書かれるはずです。
2.4.1.1 正確性を優先した難文書の文章の特徴
このように難文書は、たとえ簡潔性よりも正確性を優先して記述される傾向がありそうです。この志向により、難文書を構成する文章には以下の特徴が見られます。
同じものは同じと明記、省略は基本的にしない
詳細は割愛しますが以下の特徴が見られます。
- ひらがなで書いたほうが文章が読みやすくなりそうでも漢字を使う。
- 指示代名詞で済ませられそうでも、省略せずもう一度書く
これらにより、「同じ単語」が何度も出てくることになります。
共通部分と異なる部分の強調
正確性を追求すると、共通部分と、非共通部分(異なる部分)を明示するようになります。具体例で確認します。
具体例
『コヤマさんの飼っているミックというチンチラがカメラの前でじゃれている』という文章は、以下のとおりに自由変数(AとB)で抽象化出来ます。
- 『Aの飼っているBというチンチラがカメラの前でじゃれている』
同じチンチラであっても、誰が飼っているチンチラかを強調したい場合はAが複数列挙されます。チンチラの名前を強調したい場合はBが複数列挙されます。ここではチンチラが「共通部分」、AとBが「異なる部分」です。
形容詞と名詞の組み合わせ
言葉で現実を分ける際は、基本となる名詞(先述の「共通部分」)に対して形容詞(先述の「異なる部分」)がかかってきます。先ほどの例であれば、チンチラという名詞があって、そこに『Aの飼っている』、『Bという』という2つの形容詞枠を設けています。前者であれば『コヤマさんの飼っている』、『オオタさんの飼っている』、『ホソカワさんの飼っている』といった具合で区別がなされますし、後者であれば『ミックという』、『リンタロウという』、『タマという』といった具合で区別がなされます。
前章の化学の例であれば「結合」という概念、名詞がありますが、
などといった形容詞枠を用意して、共通の地平での異なる概念を形容詞で区別します。名詞&形容詞の構成により、複数の同じ単語が何度も色んな場所に乱雑に散らばります。以下、詳しく説明します。
名詞の頻出化
まず、同じ名詞が何度も出てきます。上の例であれば「結合」です。
名詞&形容詞の再帰的適用
更にそれに留まらないです。一度形容詞を付与された名詞は全体としても「名詞」になります。名詞は再帰的に生成されるのです。例えば『共有結合』は名詞となり、それをさらに区別するために『極性共有結合』, 『非極性共有結合』といった新しい名詞が形容詞『極性』、『非極性』と組み合わせることで出来上がります。
組み合わせ爆発
最後に、概念間の説明をする際には形容詞 × 名詞の組み合わせが掛け算が出てきます。『人間理性』, 『純粋理性』, 『純粋直観』, 『純粋悟性概念』, 、、などといった具合です。まさに組み合わせ爆発です。
結果として難文書では、同じ単語がただ単に単語が増えるだけでなく、文書全体に各種単語が乱雑に散らばることになります。
略語化
略語化(意味が残る)
この組み合わせ爆発を避けるために、長い単語はどこかの段階で圧縮・略語化されたりします。英語の場合のほうが略語化は顕著かも知れません。例えばML(Machine Learning、機械学習)などといった感じで頭文字を抽出し略語化します。英単語は横に長く展開しますからね。略語化することで単位面積あたりの情報量が多くなったり、どこまでがひと塊かを認識しやすくなります。略語化の経緯を知っておけば略語の意味も推測が出来るかも知れません。一方で、意味が残るとはいえ、要素を明示していた際(略語前)の印象が消えてしまうリスクがあります。例えば、MLは本来は、Machine Learning、Machine(機械)なのでHuman(人間)によるLearningと対比していたり、機械的処理の中でも『学習あり(何かを教え込ませる処理が入る)』か『学習なし(予めルールを与える、ルールベースというらしいです)』かを指しています。でもMLと書いてしまうとそれが意識されにくい。さらに悪いことに他の略語、例えばML(Meta Language)と混乱したりします。文書中で扱われている箇所が明らかに機械学習の文脈であれば機械学習のことかと推測が可能ですが、別の文脈、例えば政府がこれからはMLに注力しようとしてるといった場合、世事に疎い人なら勘違いしてしまうかも知れません。
略語の定義宣言
難文書では、MLのような略語を使う際は使い始めに定義が宣言されます。例えばML(Machine Learning)と書いといて、それ以降はMLで通すというものです。正確性を重視するがゆえの方策ですね。本書でも『難しい文書』のことを以降は「難文書」と呼ぶと冒頭で定義しました。
単文字・数字化(意味を求めない)
更に同じレベルの異なる概念が互いに区別されていればそれだけで良い、略語に何か意味を求めない、という趣旨で長い単語が意味のないただの数字やただの単文字に置き換えられたりします。法律系、数学系の文書で多いです。前者であれば甲乙丙丁、ABCD、アイウエ、後者であればS、V,T、X、Y、Zなどです*2。
視認性が良くなりますし、記述量が減ることで誤記も減るかも知れません。このあたりプログラマの方ならピンとくるかもですね。
あと、意味のない単文字・数字だと逆に文書内での意味が厳密になります。例えば『難文書』を『難』、『易しい文書』を『易』とする、だと地の文で略語でない意味の『易』が出てきた際に混乱します。逆に『易者』を『易』さんと略してしまうと定義をよく見ない人は何か易しい(優しい)人なのかなと意味が引きずられるかも知れません。『易』さんではなくAさんとしたほうが余計な意味がない、汚れていない、逆に文書中で定義される意味のみが際立つことになります。
ただし、読む際は必ず定義を抑えておく必要があります。また、数学系は必ず記号の定義をするはずですが、物理・工学系では定義をしなかったりする(不親切な?)教科書もあります。Tは温度、Pは圧力、Vは体積、Sはエントロピー。これらは常識なのでわざわざ冗長に説明せんでも、といった具合にです。説明が冗長になると読む気がなくなりますので、不親切とは言い切れませんが。極論だと単語全ては記号なので定義が存在しているわけで、それをいちいち説明していては何も進まないですしね。
その他作用
正確性を重視するために、以下もなされます。例えば何かの主張が以前のどこでなされていたか、ひとまず仮説化しておいてどこで述べるか、を明示するために、です。
- 読みやすくするために小見出しが用意される(この文書にも多用されています。地の文と比べて文字が大きくなっていますし、目次にも出てきます。)
- 読みやすくするために数字、記号が振られる。(例:第2章第1節(教科書)、第2章第3項第1号(法律)、定理3、証明4(数学)などです。)
正確性とは関係ないのですが、難文章では仮説に対する結論の説得力を上げるために実験結果で数字を用意したりしています。実験条件でも数字が出てきます。
以上が難文書の特徴とそれに起因する文章の難しさでした。途中途中で触れてますが、次章への布石として読者目線でまとめておきます。
2.5 読者目線での難文書の難しさ
2.5.1 同じものは同じと明記、省略は基本的にしない
気の利いた省略はなされず、文章中に同じ単語ばかりが続くので退屈になります。毎日が同じことの連続だとどうですか?また、文章が長くなるので単位面積あたりの情報量が減ります。眼球が疲れてしまいます。さらに難文書が知らない領域の場合は「知らない単語の見かけの数」が増えます。
2.5.2 形容詞と名詞の組み合わせ
上記「同じ単語」のもたらすデメリットと同様の効果があります。またそれだけでなく、広い範囲で単語が乱雑に散らばるので見分ける労力が発生します。間違い探しをしている感があります。さらに、再帰と組み合わせ爆発が発生し、上記デメリットがとめどなく広がる潜在的リスクがあります。
2.5.3 略語化
常に略語の定義を頭に入れておく必要が出てきます。記憶力の弱い人は略語の定義を確認するためにいちいち読み戻る必要があるかもです。頭文字を抽出するなどの意味の残る略語化であればマシですが、数字、記号のような意味を求めない略語化の場合は本当の記憶力が問われます。人間を番号ではなく名前で呼んだほうが良いのはその人の尊厳を守る意味だけでなく、イメージしやすいという理由もあります。略語化されると読み飛ばしもキツイかも知れません。途中でわからない単語が出てくるだけでなく、その文書特有のローカルルールが途中で潜んでいる可能性は十分にあります。
2.5.4 小見出しと数字、記号付与
うまくやれば読みやすさにつながります。一例では、小見出しだけを読めば本の内容がだいたい分かるといった使い方です。
2.5.5 説得力としての数字
数字がたくさん並ぶとキツイです。単位と組み合わせると特にです。例えば企業の有価証券報告書(会社の状態、売上とかそういうのが書かれる)を思い浮かべてみてください。『売上』、『%』、『増加』、『減少』、『円』、『ドル』、『年度』、『年』、『株』、『経常利益』、『利益率』などなど。どれがどれか、会社にとり良いことなのか悪いことなのか、慣れていないと訳がわからなくなります。慣れていても読むのは少し疲れます。