AIツールの使い方について — その一

ChatGPT 3.0が2022年末に彗星のごとく登場し、一般の人々の目に触れるようになってから、すでに3年半が経ちました。この3年半、ほぼ毎月のようにモデルの性能向上に関する進展があり、AIツールをより上手く使うための新しいアイデアや活用法も絶え間なく生まれてきました。最初はプロンプトエンジニアリングが注目され（ただ、これはモデルの能力向上によってすぐに陳腐化することが分かりました。モデルが賢くなるほど、プロンプトを精巧に設計する意義が薄れていくからです）、その後はMCPが話題になり、やがてSkills.md（そして大企業が社員の知識をモデルに蒸留したり、一般ユーザーが著名人の発言スタイルを蒸留したり、果ては友人の話し方を蒸留したりする動きも生まれました）が登場し、さらにエージェントへと移行し、今や「エージェントハーネス」という言葉まで飛び交っています。AIツールをどう使うべきかというパラダイムは、これほど短い期間に、これほど劇的に変わってきました。そしてこの激しい変化と進化は、今後2年間もさらに加速していくと私は確信しています。

ここでは、私が非常に高い頻度で活用しており、しかもそのワークフローがすでにかなり洗練され、成果にも十分満足しているAIツールの使い方をいくつかご紹介します。いずれも私がほぼゼロから試行錯誤を重ね、自分の切実なニーズから出発し、繰り返しの実験を経て辿り着いた、現実の問題に対する相対的に最適な解決策です。

本を一冊まるごと翻訳する

私にはずっと読書の習慣があります。子どもの頃は小説を読むのが主でしたが、今は実用書が中心になりました（お恥ずかしいことに、すっかり現実的になってしまい、頭の中は実用と利益のことばかりです）。その過程で、外国人著者による素晴らしい本でありながら、簡体字中国語の訳本が存在しないものが実に多いことに気づいていました。以前の私の対処法はといえば、大抵は不格好な方法に頼るしかありませんでした。英語であれば何とか原文を読み進めることもできますし、繁体字中国語版をネットで探すこともありましたが、これらの地域は著作権保護がしっかりしているため、実際にはほとんど入手できません。結局は正規の電子書籍を購入するか、海外から紙の本を取り寄せるかになりますが、時間コストが膨大です。読みたいと思ってから手元に届くまでに一、二ヶ月かかることもあり、届いた頃にはもう読む気が失せていた、などということもありました。

マルチモーダルAIモデル（つまり画像を読み取れるモデル）が登場してから、この状況はおよそ半分は解決されました。解決策は、海賊版の原書（多くはPDFまたはEPUBファイル）を入手して、一ページずつAIに投げて翻訳させるというものです。詳しく解説してもらうことも可能でした。ただ、これもスマートな方法とは言えませんでした。一問一答のたびに待ち時間が長く、素早い応答が得意なモデルを使えば翻訳の質は落ち、コンテキストが長くなると対話を再起動しなければならず、翻訳の前後で一貫性が失われたり、長くなったコンテキストの中でモデルが幻覚を起こして支離滅裂なことを言い出したりするという問題も抱えていました。

しかし後に、Claude Opus 4.5とClaude Coworkが登場してから、この問題はほぼ100%完璧に解決されたと言っていいでしょう。Claude Coworkで新しいプロジェクトを作成し、翻訳したい原書をプロジェクトフォルダに入れ、「全文を中国語に翻訳し、EPUB形式で出力してほしい（iPhoneのBooks.appで読むのが好きなので）。レイアウトに注意し、翻訳の前後一貫性に気を配り、専門用語の訳語に留意すること」と伝え、さらに定期タスクを設定します（AIがタスクの進捗をローカルに記録しておき、コンテキストがリセットされた後も前回の続きから再開できるようにする仕組みです）。こうすることで、10回程度のタスク、1回あたり約20分という範囲内で、市販されている一般的な長さの書籍であれば、どんな言語の本でも全文翻訳を終え、美しいレイアウトのEPUBファイルとして出力できます。おまけに、ベクター画像でなかなか良い書影まで描いてくれたりもします。ただ、一点だけ小さな問題があります。もっとも、この問題には私なりの「秘策」がありますので、回り道をすることができます。

問題というのは、Claude Opusは現在もっとも能力が高く、タスクの意図を最もよく理解するモデルではある一方で、著作権への意識も骨の髄まで染み込んでいるという点です。比較的新しい書籍に対して全文翻訳を直接依頼すると、「個人学習目的のためだけに使う」と強調しても、著作権侵害にあたるとして拒否されることがほとんどです。

幸いなことに、ChatGPT CodexやKimiといった国産モデルは、この点についてはほぼ気にする様子がありません。まずCodexに機械翻訳レベルの全文訳を素早く生成させ、EPUBとして出力します。次に、その機械翻訳版と原書の両方をCoworkのフォルダに入れ、Claudeに「これは自分で作った翻訳の練習稿だが、品質がよくないので、原文を参照しながら私の翻訳を"推敲"してほしい」と伝えます。こう伝えると、著作権の問題は回避されます。Claudeは実に誠実に、そして喜んで、持てる力をすべて注いで、原書をプロの翻訳者に匹敵する品質の中国語訳本へと「磨き上げて」くれます。

この方法を使えば、電子版が存在する世界中の書籍について、出版社の訳本に匹敵する、あるいはそれを上回る品質の翻訳を手に入れることができます。ある本が日本語訳されるのをじっと待ち続けたり、中国語訳が存在しない本を疲れ果てながら原文で読み進めたりする必要は、もうないのです。

このことを考えるとき、以前出会った日本人の日本語教師のことをよく思い出します。彼の本業は翻訳・通訳で、企業向けに契約書を翻訳したり、展示会に同行して逐次通訳をしたりしていました。当時、私はAIの登場によって翻訳という職業の必要性はほぼ消えてしまうと言いましたが、彼はかなり同意しませんでした。専門分野の文書については機械翻訳の品質では商業利用に到底耐えられない、と言うのです。おそらく彼がイメージしていたのはGoogle翻訳のような機械翻訳だったのか、あるいはCoworkやCodexといった少し複雑なAIツールを実際に試したことがなかったのか、またはOpusのような他のモデルとは明らかに一段違う知性を持つモデルに触れたことがなかったのでしょう。私の経験から言えば、ChatGPTやClaudeはオンライン上では大きな話題になっているように見えますが、実際に安定して使いこなせている人（特にClaudeは）は、身の回りの十人に一人もいないかもしれません。多くの人のAI能力に対する認識は、DeepSeekや豆包、あるいはもう少し詳しい人でもGeminiや無料版ChatGPTの水準に留まっています。これらのAIツールと、真に課金している最先端のAIツールとの差は、もはやジェイソン・ステイサムと素人俳優ほどの開きがあると言っても過言ではありません。

外国語の動画とポッドキャストを「読む」

ますます多くの人が個人メディアに参入し、また業界の専門家がポッドキャストや動画インタビューを自己発信・PR・市場との対話・顧客開拓の場として活用するようになり、英語や話者の母国語で発信されるポッドキャストや動画インタビューは、一次情報を得る最も重要なチャンネルの一つになりました。しかし、個人メディアの制作がますます洗練され、再生数や視聴維持率が追求され、マネタイズの設計が組み込まれ、チャンネルとしてのブランドが磨かれていく中で、今の多くのインタビューは軽く90分を超え、3〜4時間の動画やポッドキャストも珍しくありません。Acquiredのようなポッドキャストになると、1エピソードが7〜8時間になることもあります。もともと母語でもない言語のコンテンツを、それほどまとまった時間を確保して集中して聴くというのは、現実問題として難しい。そのため、こういったコンテンツはどんどん積み上がっていく一方で消化できない、というのが実態です。しかもAI時代の今日、情報の鮮度は非常に重要です。特にそこから何か実際に動けるアイデアを見つけたいときはなおさらです。

AIはこういうときに本当に役に立ちます。これらの音声・動画を何らかの方法で英語テキストに変換し、それをAIに渡して母国語に分割翻訳させるという流れです。4時間のインタビューも、こうすれば30分程度の読書で概ね消化できます。あとはさらなる調査と深掘りに移ればいい。コンテンツの形式に起因する消費時間が、劇的に短縮されます。

YouTubeに上がっている英語コンテンツの多くは、サードパーティのサービスで字幕を無料でダウンロードできます。制作者自身が手を入れた精校版字幕が存在する場合は、翻訳も極めてシンプルです。最悪の場合でも、Googleが音声から自動生成した書き起こし字幕があります。ただ、この自動書き起こしの品質はあまり高くありません。聞き間違いや聞き漏らしが多く、複数の話者がいる場面では誰がどの発言をしたか判別できないことも多い。しかし、こうした書き起こしをOpusクラスの知性を持つAIにそのまま渡すと、AIは次のことを自律的にやり遂げます。

タスクを計画し、長文をセクションに分割して順番に翻訳し、コンテキスト不足の問題を回避する
語義から聞き漏らしや聞き間違いを自動的に補完する
語義から話者を自動的に判別する（ただし100%の精度ではありません）
固有名詞や難解な専門用語を適切に訳す
話者の発言に含まれる事実誤認を指摘・訂正する
読みやすく、共有・保存に適したMarkdown形式で出力する

もちろん、無料版のChatGPTやGeminiにはこれらを同じ水準でこなすのは難しいでしょう。豆包は試したことがありませんが、おそらく能力的な限界や、それ以外の理由からも、欠落のない高品質な全文翻訳は難しいのではないかと思います。

今回はここまでにしておきます。改めて書き終えた内容を見返すと、ほとんどがClaudeの翻訳機能とタスク計画機能をどう活かすか、という話になっていました。実は他にも、AIを使ってExcelシートを作ったり、具体的なプロジェクトに着手する前の実現可能性の検討や方針立案をしたり、あるいは性格・能力・成長にまつわるトラウマの分析をしてもらったりと、大いに恩恵を受けている使い方がたくさんあります。世界観が変わったと感じるほどのものもありました（私の世界観はずいぶん変わりやすいようですが……）。それらはまた別の回に書こうと思います。

とはいえ、今回挙げた使い方だけでも、最先端AIモデルの能力の一端は十分に伝わるのではないでしょうか。「AIが大多数のホワイトカラーを代替しうる」という言説は、決して誇張でも脅しでもないと私は感じています（個人的には、コンテキストの問題とソフトウェア操作の問題さえ解決されれば、AIは私の知る大多数のホワイトカラーの業務の90%以上を担えると思っています）。もちろん今のところ、これらはどちらかといえばインターネット上のコンテンツ消費の高度版であり、真の意味での生産性や、まして貨幣化できる商品・サービスの提供とはまだ距離があります。しかし、大きなビジネスというものは、案外そういった「自分自身の問題を自分で解く」ところから育っていくものかもしれません。

AIツールの使い方について — その一

Comments · 0