以前のプロジェクトXさらに先月(9月29日)の日テレ「未来創造堂」でいろいろ聞かれるので、本当のところを書きます。

  「未来創造堂」について質問されること多いので、NHKプロジェクトXにいたるまでの実態を河田の視点から思い出して見ます。

昔の企業内開発というのは、今ほど精緻ではなかった。だから余裕もあったということです。これは研究所の話で、事業部の話ではないことは注意してください。当時の中央研究所(1970年代)は企業の飾りのようなもので、あまり実業での貢献は期待されていませんでした。

1.始まり

ある日研究所のG所長(副所長がビデオにでた森さん)のところへ呼ばれ、これから何をやるのかと聞かれました。入社3年目のことです。日本語文章の自動要約をやりたいといったところ、「何年かかるのか?」と聞かれ、「10年ぐらいはかかります」と答えました。(結果的に嘘ですね、まだ実現されていません。最近ビルゲーツ研究所でやっているという話は聞きましたが)。
「では中間成果は何か」と問われ、「意味が分かれば機械翻訳(日英相互自動翻訳機)ができます。3年です」と答えました。「より直近の成果は何か?」と問われ、京大で研究しているときに、文章入力のために私がツールとして開発したローマ字漢字変換を使えば「かな漢字変換文章入力装置ができます。3ヶ月です」と答えました。
G所長と森さんは「だったら、秋の成果発表会までに作ってデモをしろ」ということになりました。まあ、プロジェクト管理も何もあったものではない開発です。
しかし、この世には漢字を表示するディスプレーもないし、漢字プリンターもない(数千万円の装置が東芝に一台在っただけでした。CAD用です)。コンピュータにつながる漢字ディスプレーと、漢字プリンターを作ることからはじめなければなりません。ハードの知識が必須です。ディスプレーはソニーテクトロニクスの波形観測機の走査回路に勝手に漢字表示用の回路を取り付けました。定期保守の時にははずす約束でつけました。プリンタは日野工場の倉庫に眠っている新聞社用のものをトラックに積んでもって帰りました。これも、独立型の機械ですので、古い図面とにらめっこで、コンピュータにつながる回路を作って取り付けました。この二つは2週間でできました。IBMコンピュータのインターフェース回路の知識が役立ちました。いよいよ、システム作りです。どうやって3ヶ月で作ったのでしょうか??
 河田がかな漢字変換プログラムと辞書の作成、天野さんがテキストエディター、武田さんがその他アプリ。ということではじめました。OSは現テックの技術本部長の麻田さんが画像処理用に作ったもの(PDP11風に東芝向けにコーディングしたもの)を、言語用に変えたtospics-Lというのです。当時は漢字を読み取る機械OCRが本業なので、森さんの指導は「合間を縫ってやる」が基本でした。私は漢字パターンの大分類装置(はじめての特許取得アイデアを大型基板3枚分に実装)を作りました。幸い、ほかの方の部分でトラブルがあり、OCR自体は半年以上遅れましたので、まっている間にかな漢字の時間が作れました。(プロジェクト管理としては変) あとでアンダーザテーブル研究と呼ばれていたのですが実態はこのようなものです。
 森さんは一切口を出さずに、「どうなっている」とも聞かずにほっておいてくれました。自分がマネージャーになってからは、フォローする誘惑が大きいのを後に実感しました。


2.かな漢字変換アルゴリズムはどう思いついたの? 

 京都大学で研究していたときに、すでにこうすれば簡単と言うものを見つけていました。それは、日本語の文節の成り立ちは数学であらわせるという、三省堂の受験参考書「日本語文法」を読んでいたからです。樺島忠夫先生の本です。内容は受験参考書としては破格(反則)な内容です。絶対受験に役立たないが、コンピュータの専門化にとってはすばらしいことがいろいろ書いてありました。樺島先生が、京大の長尾教授(コンピュータ言語処理の開祖。後の京大総長)と友人だった影響かと思います。この本を信じて形態素や、5段活用などをどんどんプログラム化するわけです。コーデ−ングに1週間。 フォートランという科学計算用の言語です。カードでプログラムを作り、コンパイルは一日一回のターンアラウンドです。夜中は大型計算機室にダウンジャケットを着て(機械のために寒い)入れば何度もコンパイルでき、時間を稼ぎました。
 3ヶ月でできた秘密はこれです。いわゆるコンピュータでのシュミレーションです。辞書も大型計算機に入れておき、入力分に対する変換結果を磁気テープ(これも死語)で取り出して漢字ディスプレーとプリンタに出す工夫です。実物を作る前に、ソフトに機能を実証する。つまり、「これっていいでしょ。本当の機械を作らせてください」というのが成果発表会の裏の狙いでした。このシュミレーションは研究所の伝統で、森さんが郵便番号読取装置を開発したときに使った手です。「上司は物を見ないと意思決定できない」という、ある意味では傲慢な考え方でした。最近ではLSIは設計の段階でコンピュータシュミレーションするのが当たり前ですが、当時は新しいやり方でした。これはMITから学んだものです。
 やってみてはじめて、重要なことを発見しました。やはり凡人は現物を見ないと分からないということです。それは特許につながる、重要なことです。
 シュミレータで得た変換結果を表示すると、同音異義語が沢山出てきます。それを文章のはじめから一つずつ選択するのは面倒です。ビジネス文書や技術文書では、同じ単語が何回も出ます。一度使ったものを優先するようにすると手間が減ると気がつきました。それが学習機能の発見です。これはやってみてはじめてわかりました。いつものように3人(河田、天野、Tさん)でだべっているときに「そうだそうだ」となりました。重要な発見でした。学習機能の発見はこんなものです。
 辞書も最初は簡単に考えていましたが、国語辞典には「日本語」という語がないことを知り愕然としました。国語辞典は日本語の知識があることを前提にした編集がなされているから、日本語という見出しは不要なのです。機械はそうはいきません。ゼロから知識を与えなければなりません。「にほんご」が「日本語」に変換できなければお話になりません。そこで奮起して、生きた言葉を選ぼうとしました。国立国語研究所のこれまでの膨大の名各種研究の集積が役に立ちました。ただ紙のかたちでしかないので、デジタル化は我々がやりました。 固有名詞では駅名などは発音が分からないときは、駅員まで電話して読み方の問い合わせをしたりしました。
 デモは大成功で、日本語をキーボードで入れることが出来ると、多くの方に信じてもらえました。

 シュミレーターでは実用的でないので、当時のミニコンピュータマイクロコンピュータが出現する前です 古いですねー)に移植することを行いました。出来上がった装置はどうしても2−3千万円ぐらいします。買えるのは新聞社と放送局だと狙いをつけて、売り込みに行きました。研究者が自ら行くわけです。性能のよさと、必要性は認めてくれますが買ってはくれませんでした。新聞社には専任タイピストがわんさかいる会社ですから。タイピストはどこも余っていました。
 ということで、所長をはじめ森さんも、私たちも事業化はあきらめていました。つまり開発はやるが、事業としては行き当たりばったりだったというのが真相です。

 そのとき青梅からM部長が突然やってきて、「事業化する」と宣言しました。ここから、プロジェクトXの番組に続きます。 あとは省略です。プロジェクトXの番組は結構正確です。誇張したエピソードは一切ありません。NHK発売のDVDです。TSUTAYAでレンタルできます。


 未来創造堂のラーメン屋のシーンは全くの捏造です。議論はいつも仕事場で話し合っていましたので、回りからは「うるさい」とは言われました。
最後に河田の俳優がそっくりだというので、少々不満です。