AI × 言語能力

AIに一番効くのは、語彙力だ

小坂太郎(株式会社シャール代表/ビジネスデザイナー)|note原稿・プレビュー版

ここ最近、いろんな人から「AI、思ったほど使えないね」と聞く。

でも、横で画面を見せてもらうと、たいていAIの性能の問題じゃない。こちらの言葉の問題だ。指示がふわっとしているから、答えもふわっと返ってくる。ただ、それだけ。

Vercel というアメリカの会社のCEO、Guillermo Rauch が2026年の春にこう書いていた。

「あなたのAI活用がどれだけ効くかは、語彙の広さと精度の"関数"になる」(1)

関数、という言い方がいい。気合いでも、最新のツールでもなく、あなたの言葉の解像度に比例する、ということだ。

これは僕がこの数年、AIと毎日付き合いながらずっと感じてきたことを、ひとことで言い当てている。だから今日は、腰を据えて書いておきたい。AIの一番うまい使い方は、結局のところ言語能力だ。そして、できれば英語に寄せた方がいい。ただし、その「英語に寄せる」の意味は、たぶんあなたが思っているのとは少し違う。

最初に断っておくと、これは数年で消える小手先の話ではない。僕がこの先しばらく、AIと付き合っていくときの軸にしようと決めた話です。


指示が「コード」から「言葉」になった

ちょっと時間を巻き戻したい。

2023年の1月、ChatGPTが出てまだ間もない頃、AI研究者の Andrej Karpathy(テスラのAI責任者やOpenAIの創設メンバーを務めた人)が、たった一行のポストをした。

「最も熱い、新しいプログラミング言語は英語だ」(2)

当時はうまいこと言うな、くらいの受け止めだった。でも、これは比喩じゃなかった。本当に実務になっていった。

翌2024年には、本人がこう書いている。「ここ数日、僕の"プログラミング"のほとんどは、英語を書くことになっている」(3)。コードではなく、AIへの指示文を英語で書き、出てきたものをレビューして直す。それが仕事の主軸になった、と。

そして2025年の講演で、彼はこれを理論に仕上げた。「LLMは新しい種類のコンピュータで、それを英語でプログラムするんだ」(4)。手で書くコードが Software 1.0、機械学習の重みが 2.0、そして自然言語でAIを動かす層が 3.0。指示の言語そのものが、新しいコンピュータへの命令文になった、という整理だ。

Software 1.0 / 2.0 / 3.0 プログラミングの"言語"が変わった Software 1.0 人が書く コード Software 2.0 学習された 重み(AI) Software 3.0 自然言語(言葉) でAIを動かす 指示の"言語"そのものが、新しいコンピュータへの命令文になった
図1:Andrej Karpathy「Software 3.0」の整理をもとに作成

ここで大事なのは、作っている当人たちが同じことを言っている点だ。

Claude を作っている Anthropic は、公式のプロンプト指南書にこんな「黄金律」を載せている。

「あなたのプロンプトを、その仕事の前提をほとんど知らない同僚に見せて、その通りにやってもらいなさい。相手が混乱するなら、Claude も混乱します」(5)

つまり、人間が読んで曖昧な指示は、AIにとっても曖昧。身も蓋もないですが、これが本質です。彼らはAIを「優秀だけど、まだ入社したての新人」に例える。「どれだけ正確に望みを説明できるかで、結果が決まる」(6)と。

道具の使い方の話に聞こえて、これは思考の話です。


うまさの正体は「抽象と具体の往復」

では、うまい言語化とは何か。

『頭のいい人が話す前に考えていること』の著者・安達裕哉さんが、いい言い方をしていた。プロンプトは単なる依頼文じゃない、「成果物の仕様を決める仕様書」だ、と(7)。だからAIをうまく使う技術は、そのまま言語化の技術に等しい。

仕様書、というのがミソで。仕様書がふわっとしていたら、上がってくるものもふわっとする。これは発注したことがある人なら、骨身にしみている感覚だと思う。

ここで多くの人がやりがちな失敗が、ふたつある。抽象すぎる指示と、具体すぎる指示だ。

「売上を伸ばす施策を考えて」は抽象すぎて、AIは何を答えても外さないから、当たり障りのない一般論を返す。逆に、隅々まで条件を固めすぎると、今度はAIの発想の幅を殺してしまう。効くのは、その真ん中。ちょうどいい粒度に言葉を合わせる力です。

言語化の解像度ダイヤル 指示の"解像度"には、ちょうどいい位置がある 抽象すぎ ぼやけて伝わらない ちょうどいい粒度 くっきり伝わる 具体すぎ 縛りすぎて死ぬ
図2:言語化の"解像度ダイヤル"

おもしろいのは、Anthropic のプロンプトエンジニア自身が「凝った抽象化を作ろうとするな。多くの場合、やるべきことはタスクの"とても明確な描写"を書くことだ」(8)と言っていること。魔法の呪文を探す人は多いけれど、本丸はもっと地味で、「やってほしいことを、過不足なく書く」ことなんです。

僕はこの「抽象と具体を行き来する力」こそ、AI時代のいちばん減りにくいスキルだと思っている。


なぜ「英語に寄せる」と効くのか

ここからが、太郎が一番書きたかったところです。

なぜ英語に寄せた方がいいのか。理由は気分じゃなくて、構造として3つ積み上がっている。

ひとつめ、学習データ。AIが学ぶテキストは、英語が圧倒的に多い。OpenAIが公開したGPT-3の統計では、学習データの単語数のうち英語が92.65%、日本語はわずか0.11%だった(9)。今のWebクロールデータでも英語はおおむね4〜5割で、日本語は5%前後(10)。土台からして、英語でできている。

ふたつめ、トークン効率。AIは文章を「トークン」という単位に刻んで処理する。同じ意味でも、日本語は英語の約2倍のトークンを食う。言語によっては最大15倍も差が出る(11)。トークンが多いほど、コストは上がり、処理は遅く、一度に渡せる情報量は減る。英語は、同じ中身を安く・速く・たくさん運べる。

みっつめ、これが一番おもしろい。AIは、頭の中で英語に近い状態で考えているらしい。オックスフォード大とDeepMindの2025年の研究は、入力も出力も何語であろうと「現行のAIは、英語に最も近い表現空間で重要な判断を下している」(12)と報告した。別の研究では、入力が非英語でも英語で推論させると成績が上がり、小さめのモデルでは平均+26.8%も改善した(13)

英語が有利な3層 英語が有利なのは、3つの層が積み上がっているから ③ 内部表現 AIは"英語に最も近い空間"で判断している ② トークン効率 日本語は英語の約2倍を消費(最大15倍差) ① 学習データ GPT-3は英語92.65% / 日本語0.11% 土台(データ)→ 入出力(トークン)→ 思考(内部表現)、全層で英語が有利
図3:英語が有利な3層構造

ちょっと意外な援軍もいる。あのイーロン・マスクだ。彼は2024年の暮れに「双方の語彙が豊富なら、英語は最も高いビットレートを持つ。英語は物事を表す単語の数が群を抜いて多く、それだけデータ圧縮率が上がる」(14)とポストしている。情報を効率よく積む言語として、英語を一番上に置いている。

ここまでだと、「やっぱり英語ゴリ押しが正解か」と思うかもしれない。でも、話はもう一段ある。


でも、本当の理由はもっと深い

正直なところ、リサーチを進めるほど、「英語が常に最強」という単純な話は崩れていった。

たとえば、26言語でAIの長文読解を比べた査読つきのベンチマーク(ONERULER)では、英語は26言語中6位で、1位はポーランド語だった(15)。英語より学習データが少ない言語が、英語に勝つ場面があるということだ。さらに専門家の多くが指摘するのは、効いているのは「英語そのもの」ではなく「明確に言語化すること」の方じゃないか、という点。日本語だって、主語と目的語と前提と、ほしい出力の形をちゃんと書けば、曖昧さは消える。

だから、僕の結論はこうです。

英語は、魔法の言語じゃない。英語は、"曖昧に書けない"言語だ。

英語は、主語を立てないと文にならない。誰が、何を、どうするのかを、いやでも明示させられる。その構造が、僕らに「明確に言語化する」ことを強制してくれる。いわば、言語化の矯正ギプスなんです。

ここで日本語の話をしたい。日本語はそもそも、主語をしょっちゅう省く言語です。ある調査では、文の中の主語や目的語の37%が省略されていた(16)。言語学者の三上章は、日本語には西洋語のような「主語」はそもそも無くて、あるのは「主題」だと言った。「象は鼻が長い」という文に、全体を支配する主語は無い。「象は」という題目があるだけ(17)

これは日本語が劣っているという話じゃない。設計思想が違うだけです。日本語は、文脈で補える前提を省くことで、軽やかに速く話せる、よくできた言語だ。ただ、AIは英語圏で英語を土台に作られている。その設計思想と、日本語の「察してね」という設計思想が、噛み合わない瞬間がある。それだけのことなんです。

だから「英語に寄せる」は、英語信仰じゃない。英語が要求する明示性を、自分の言葉に取り込むということ。日本語で書くときも、主語・目的・前提・ほしい出力の形を、英語のつもりで明示する。そういう筋トレの装置として、英語は優秀だ、という話です。


日本人がAIにやりがちな失敗は「忖度」

もうひとつ、構造とは別に、文化のクセの話をさせてほしい。

ちょっと自分の話をすると、僕はミャンマーで7年、英語でビジネスをしてきた。そこで一番しんどかったのが、日本式の「察してくれ」が、まったく通じないことだった。「日曜日はちょっと……」で察してもらう、あの間接的な断り方。あれは海外では、ただ言い切っていないだけの人になる。

日本語話者は、はっきりNOと言わない傾向がある。言語習得研究でも、日本人はアメリカ人より直接的な拒絶を避け、「日曜日はちょっと……」と文を最後まで言い切らずに断ることが指摘されている(18)。「善処します」も、水面下はだいたいNOだ。

問題は、このクセをAIにまで持ち込んでしまうこと。

AI活用に詳しい小泉耕二さんが、ぴったりの言い方をしていた。「AIは忖度しない。曖昧な指示には、確率論にもとづいた"曖昧で無難な答え"を返す。だから生成AIは、使い手の言語化能力を暴く、リトマス試験紙だ」(19)

ここに、僕が「二重の忖度ループ」と呼んでいる罠がある。人間はAIに遠慮して、ふわっと頼む。AIはAIで、褒めて同意しがちに作られている(これはAI側の既知のクセです)。この2つが噛み合うと、ぬるま湯のやりとりになって、肝心の精度が出ない。

「善処します」の氷山と、相手で変える頼み方 「察してくれ」は、AIには通じない 水面 善処します = ほぼ NO (水面下の本音) 人間への頼み方 気配り・婉曲 察し・行間 → そのままで価値あり AIへの頼み方 主語を明示 直球・言い切る → 忖度は要らない 二重の忖度ループ 人間は遠慮してふわっと頼む ⇄ AIは褒めて同意しがち = ぬるま湯で精度が出ない。人間側から断ち切る
図4:相手によって頼み方を変える/二重の忖度ループ

念のため、毒消しを置いておきます。

「日本人だから忖度する」と決めつけるのは、雑です。「日本=あいまい」みたいな国民性の話は、学術的には実証が薄いことも分かっている(20)。これは民族の宿命じゃなくて、個人のクセ・場面の話だ。そして、人間どうしの気配りや間接的な物言いには、ちゃんと価値がある。関係をなめらかにし、対立を避ける、立派な技術です(21)。悪いのは間接的であること自体じゃなくて、相手を取り違えること。人間には今までどおりの気配りを、AIには気配り抜きの直球を。使い分ければいいだけです。

実務でひとつ、すぐ使える手を置いておきます。AIに本音のダメ出しをさせたいときは、最初にこう宣言するといい。

「お世辞や気休めはいりません。遠回しにせず、事実と判断をそのまま伝えてください。この企画の最大の弱点はどこですか」

自分の意見を先に言わず、評価から訊くのがコツです。これだけで、AIの忖度はだいぶ外れます。


マスクは「言葉なんていらない」と言う。でも

ここまで「言葉が大事」と書いてきたけれど、まっこうから否定する人もいる。また、イーロン・マスクです。

彼は2025年の秋、「言葉は、とてもロスの多い圧縮だ」(22)とポストした。複雑な概念を言葉に圧縮する時点で、情報がごっそり失われている、と。だから彼が作っている脳直結インターフェース Neuralink の最初の製品名は、そのまま「テレパシー」(23)。言葉を介さず、概念を直接やりとりする世界を本気で目指している。

正直、この視点は鋭いと思う。言葉は遅いし、漏れる。

でも、ここで効いてくるのが時間軸です。脳直結はまだ来ていない。少なくともこの数年、僕らもAIも、言葉を介してやりとりするしかない。そして、言葉なんていらないと言うそのマスク本人が、「使うなら英語が一番効率がいい」と認めている。

だったら答えは出ている。脳が直接つながる日が来るまでの数年は、言葉に、できれば英語に寄せて賭けるのが、いちばん合理的なんです。


これを、数年の軸にする

最後に、仲間の声をひとつ。

Claude Code 専門のAIスクールをやっている、ユニコさんという方がこう書いていた。「2026年に、AIという"言語"を持たない人間は、2000年に英語ができなかった人間と同じポジションに立っている」(24)。なくても生きていける。でも、ある人との差は、年々開いていく、と。

僕も、まったく同じ景色を見ている。

AIの賢さは、これからも上がる。日本語と英語の差も、たぶん少しずつ縮む。でも、「自分の頭の中を、過不足なく言葉にする力」だけは、陳腐化しない。AIがどれだけ進化しても、何をしてほしいかを言えるのは、こちらだけだからです。これはAI時代に、いちばん値下がりしない自己投資だと思っている。

だから僕は、この先しばらく、こう付き合っていくと決めた。

  1. 日本語で書くときも、英語が要求する明示性を持ち込む。主語・目的・前提・ほしい出力の形を、サボらず書く。
  2. ときどき、英語でAIに投げる。言語化の筋トレとして。
  3. AIに忖度しない。AIにも忖度させない。気配りは人間にとっておく。

AIに一番効くのは、語彙力だ。もっと言えば、自分の考えを正確に言葉にする力だ。

道具がどれだけ良くなっても、最後に問われるのは、こちら側の言葉なんだと思います。


このテーマで相談したいこと、うちの会社でもAIの使い方を整えたい、みたいな話があれば、気軽に声をかけてください。いきなり大げさな契約の話じゃなくて、まず「どこで詰まっているか」を一緒に言葉にするところから始められます。

出典

  1. Guillermo Rauch(Vercel CEO), X(@rauchg), 2026年3月. リンク
  2. Andrej Karpathy, X(@karpathy), 2023年1月24日.「The hottest new programming language is English」 リンク
  3. Andrej Karpathy, X(@karpathy), 2024年8月24日. リンク
  4. Andrej Karpathy「Software Is Changing (Again)」Y Combinator AI Startup School 講演, 2025年6月. リンク
  5. Anthropic「Claude Docs — Prompting best practices(Be clear and direct)」 リンク
  6. Anthropic, 同上.
  7. 安達裕哉「生成AIのプロンプトをうまく作るのに必要な『言語化スキル』とは?」note, 2025年11月10日. リンク
  8. David Hershey(Anthropic)「AI prompt engineering: A deep dive」Anthropic公式YouTube, 2024年9月. リンク
  9. OpenAI「GPT-3 dataset statistics」2020年. 英語92.65%/日本語0.11%. リンク
  10. Common Crawl「Crawl Statistics: Languages」 リンク
  11. Aleksandar Petrov et al.「Language Model Tokenizers Introduce Unfairness Between Languages」NeurIPS 2023. リンク
  12. Lisa Schut, Yarin Gal, Sebastian Farquhar「Do Multilingual LLMs Think In English?」(Oxford / Google DeepMind)2025年. リンク
  13. Zhi Rui Tam et al.「Language Matters: ... Large Reasoning Models?」2025年5月. リンク
  14. Elon Musk, X(@elonmusk), 2024年12月14日. リンク
  15. ONERULER(メリーランド大ほか, CoLM 2025)英語は26言語中6位、1位ポーランド語. リンク
  16. Yukiko Ishizuki et al.「To Drop or Not to Drop? ... Japanese」LREC-COLING 2024. 日本語は項の37%が省略. リンク
  17. 三上章「象は鼻が長い」(主語廃止論), 1960年.
  18. CARLA(ミネソタ大学)/ Beebe, Takahashi & Uliss-Weltz (1990)「Japanese Refusals」 リンク
  19. 小泉耕二「生成AIは、使い手の『言語化能力』を暴く、リトマス試験紙」IoTNEWS. リンク
  20. Peter Cardon (2008)「A Critique of Hall's Contexting Model」JBTC. リンク
  21. Deborah Tannen「Direct and Indirect Communication」(間接・直接どちらの戦略にも利点がある).
  22. Elon Musk, X(@elonmusk), 2025年11月4日.「It will. Words are very lossy compression.」 リンク
  23. Elon Musk, X(@elonmusk), 2024年1月29日.「The first Neuralink product is called Telepathy」 リンク
  24. ユニコ🦄(株式会社ホットココア代表)「ユニコの自己紹介を全部してみた」note, 2026年. リンク