賞賛のメモ
希望小売価格159.00ドル
「魅力的だと思うかどうかは別として、Plaud Note は最も実用的な AI ハードウェアであり、期待を上回るものです。」
長所
- 驚くほど薄くて軽い
- かなり正確な転写
- 要約テンプレートは便利です
- AIモデルの選択
- 類似の電話アプリよりもはるかに優れています
短所
- すべての機能はサブスクリプションでロックされます
- 英語以外の書き起こしは磨きをかける必要がある
「Digital Trendsを信頼できる理由 – 私たちは20年にわたり、製品、サービス、アプリのテスト、レビュー、評価を行い、お客様が適切な購入決定を下せるようサポートしてきました。製品のテストと評価方法について詳しくは、こちらをご覧ください。」
Digital Trendsでは最近、オレンジ色のAIハードウェアを分析しました。結果は芳しくありませんでした。「これまでレビューした中で最悪のガジェット」というのがRabbit R1の評価でした。Humane AI Pinも専門家の手に負えず、同社は現在、新規販売台数よりも返品が多い状況に苦しんでいます。
おすすめ動画
最初の波が収まって以来、新たなAIガジェットが次々と登場し、日々のやり取りを常に聞き取り、学習する、魅力的なAIコンパニオンを謳っています。しかし、AIコンパニオン、特に深い感情的なつながりを求めるAIコンパニオンから私が学んだことがあるとすれば、それは、AIは柔軟であり、しかもその使い方が間違っているということです。
サンフランシスコに拠点を置くPlaudは、AIハードウェアに対して控えめなアプローチをとっている。人間の創意工夫を凌駕すると主張するよりも、実用性を重視しているのだ。最初の製品であるPlaud Noteは、洗練されたスナップオン式のデバイスで、音声メモの録音といった簡単な操作に生成AIを搭載している。音声メモの書き起こし機能に加え、要約機能も搭載されている。しかし、果たして本当に使えるのだろうか?
Plaud Noteを使うとどんな感じか

Plaud NoteはiPhone 15 Proのボタンとほぼ同じ薄さです。信じられないほど軽いのに、触り心地は抜群です。そして何より嬉しいのは、使い方を覚える必要がないことです。セットアップは簡単で、丸いボタンを押して、内部で振動を感じ、赤いランプが点滅するまで待つだけです。
あの小さな物理的なトグルが見えますか?これが下がっている時は、Noteのマイクが周囲の音を拾います。通話モードで上にフリックすると、振動伝導モーターが作動し、通話を録音します。スマートフォンとの接続はBluetooth経由で確立され、アプリを開くとすぐに、すべての録音がリストとしてきれいに整理され、最新のものが一番上に表示されます。
英語を話す方、あるいは仕事で英語でのコミュニケーションが求められる方にとって、Plaud Noteは信頼できる選択肢です。様々なアクセントで試してみましたが、問題なく動作しました。スコットランド訛りが強い時にのみ多少の不具合がありましたが、驚いたことに、書き起こしは問題なく使用できました。

難点は、専門用語、様式化された名称、口語表現です。例えば、「GPT-4o」は「G34」と誤記され、「Claude Sonnet」は「CloudSonic」と誤記されていました。しかし、これは発音の明瞭さのせいでもあるかもしれません。兄の声は明瞭に拾われ、正確に書き起こされることが多かったのですが、全く同じ文章を読んでいるにもかかわらず、私の声は時折間違えられていました。
これらのエラーについては、共有またはローカルにエクスポートする前に、書き起こしを編集できます。ただし、ここで少し面倒な点があります。書き起こしテキストファイルへの編集は、要約やマインドマップに自動的に反映されません。ありがたいことに、アプリには書き起こしと要約の再作成のための専用オプションが用意されています。
Plaud Noteは信頼できる選択肢です。
英語以外にも、ヒンディー語、ウルドゥー語、ペルシャ語、アラビア語の書き起こしも試してみました。古典ウルドゥー語の文学評論(これは、ビクトリア朝時代の英語と21世紀の現代英語の対比のように、通常のウルドゥー語と本質的に同じ対比です)でも、Plaud Noteは素晴らしい仕事をしてくれました。

書き起こしテキストはまずまずの出来で、英語以外の言語とは思えないほどの正確さでした。また、手元にある書き起こしデータに基づくと、要約も非常にうまくできていました。
しかし、スペルミスは最初から明らかで、もしそれを定量化するとすれば、精度は85%から90%程度でしょう。これらのエラーは、主に英語で学習され、ウルドゥー語データでは桁違いに低い、基盤となる言語モデルのせいだと言えるでしょう。
これらの間違いが起こるもう一つの理由は、これらの言語の表記方法です。例えば、ウルドゥー語、アラビア語、ペルシャ語を考えてみましょう。これら3言語はすべて同じ基本的な表記規則に従っています。英語の単語は文字の集合で単語を形成しますが、各文字は元の大文字または小文字で明確に区別されますが、これらの規則は前述の言語には適用されません。
これらの文字体系では、単語は複合文字であり、文字の長さや識別可能性に応じて形が変化する。さらに、「アエラブ」という文字体系は「O」「E」「A」を表す文字を見えなくし、「イザーファト」という文字体系は2つの単語を「e」で繋ぐことで事態をさらに複雑にする。

こうした微妙なニュアンスの違いから、書き起こしの結果は、読み方はほぼ正しいものの、スクリプトの観点からは実際には不正確な単語になることがよくあります。Plaud Noteを地元の大使館のポルトガル語教師に渡したところ、簡単なテスト運用の後、ネイティブのアクセントは問題なく理解できるものの、非ネイティブスピーカーの発音には苦労するだろうと推測されました。
ここでボールを握っているのはPlaudではありません。基盤となるAIモデルの開発者には、より多くの言語とアクセントをカバーするためにトレーニングデータを多様化する責任があります。AIモデルについて言えば、書き起こしと要約にはGPT-4oとClaude 3.5のどちらかを選択できます。比較すると、OpenAIのGPT-4oは十分なマージンを持ってより信頼性の高い選択肢であることが証明されています。
いくつかの追加機能、いくつかの落とし穴

人間やスピーカーなどの周囲の音源から録音した音声と、音声通話の音声品質には若干の違いがあります。前者は良好な音質ですが、通話録音は少し抑えめに聞こえます。これは全く予想通りのことです。これは、AIによる書き起こしの品質にも影響します。
この状況を改善するため、Plaudアプリには音声ゲインシステムが搭載されており、内蔵マイクの感度を調整することで、スマートフォンのイヤピースからの音声をより正確に拾うことができます。ただし、周囲の騒音レベルによっては、感度を上げすぎると録音にノイズが混入する可能性もあります。
音声通話で最適な音質を得るには、ある程度の試行錯誤が必要です。しかし、得られる音質はネットワーク品質や携帯電話回線経由かどうかにも左右されます。Wi-FiやWhatsAppでの通話は問題ありませんでした。しかし、屋内ではネットワーク干渉の影響で、Plaud Noteの音質が時折低下することがありました。
文字起こしの品質に関しては、Pixelスマートフォンにプリインストールされているレコーダーアプリにかなり近いです。私の経験では、このアプリは長年にわたり最も正確でしたが、Plaud Noteにはコンテンツを見やすい形式で要約するためのテンプレートが用意されていることを考えると、Plaud Noteに置き換えても全く問題はありません。

テンプレートも非常に便利です。バーチャルセミナーの講演セッションを録画したのですが、「講義」要約ノートは驚くほど良い見出しを拾ってくれただけでなく、核となる箇条書きや小見出しが散りばめられたすっきりとした文書も作成してくれました。私はマインドマップはあまり好きではないのですが、その機能も利用できます。
ありがたいことに、既存のオーディオクリップに対して、新たに書き起こしを行ったり、要約テンプレートを変更したりすることができます。Plaud Noteのアプローチで一番気に入っているのは、ウェブサービスやアプリを行き来する代わりに、すべてを1つのアプリで実行できることです。
でも、でも、でも…アプリがある

Plaud Noteができることはすべてアプリでできるという主張は十分に成り立ちます。実際、スマートフォンはAIエンジンをローカルで実行できるようになり、多くのスマートフォンがオフライン録音、文字起こし、翻訳機能を提供しています。しかし、それぞれのアプローチにはそれぞれ長所と短所があります。まずはアプリの状況について見ていきましょう。
Otterは、特にビジネスプロフェッショナルやジャーナリストの間で最も人気のある音声録音・文字起こしアプリの一つです。Otterは月額8.33ドルのサブスクリプションモデルを採用しており、Plaudの個人プランは月額6.59ドルですが、どちらも録音時間は1,200分までに制限されています。
Otterの最大の利点は、スマートフォンに内蔵された高性能マイクを利用していることです。そのため、録音された音声ははるかに高品質です。しかし、Plaud Noteほど多機能ではありません。これはAIの導入に起因します。Otterは現時点で英語のみをサポートしており、複数のアクセントにも対応しています。Plaud NoteはOpenAIのGPT-4oを搭載しており、59言語をサポートし、アクセントにも問題なく対応しています。文字起こしにAIを導入する最大のメリットは、スペルミスのある専門用語をそのまま文字起こしするのではなく、途中で修正を加えてくれることです。

Google キーボードのモバイルアプリまたは Google ドキュメントで音声入力をお試しください。メモや記事に話しかけると、AI がリアルタイムで修正を行います。スペル、文法、スタイルの一貫性などを修正するだけでなく、AI はあなたが話す内容を学習し、前の単語や文のブロックに必要な修正を加えます。
これが会話型チャットボットの基本的な概念です。言語モデルは次の単語を予測するように訓練されます。専門家はこの行動を統計的偶発性と呼び、人間の脳が特に得意とするものです。本質的には、単語間の複雑な高次関係が、まとまりのある言語として意味を持つクラスターを形成するのです。
同様のアプリは、Plaud Note ほど多機能なものはありません。
AIの状況は、精度と多様性の両面で、今後ますます向上していくでしょう。例えば、Metaのオープンソースモデル「No Language Left Behind(NLLB-200)」は、200以上の言語への翻訳をサポートしています。しかし、AIはPlaud Noteで書き起こされた音声クリップのスペルや文法の修正だけにとどまりません。音声メモを要約したり、マインドマップを作成したり、さらにはコンテンツを整理して分かりやすい形式にまとめるテンプレートも多数用意されています。

もう一つの実用的な利点は、ストレージ容量の問題です。ジャーナリストとして、事実確認をして関連記事を公開した後でも、インタビューの音声録音を削除できないことがよくあります。「インタビュー記録の中にどんな貴重な情報が見つかるかなんてわからない」とよく自分に言い聞かせます。それが携帯電話のストレージを圧迫するのです。
最悪なのは、最近のスマートフォンではmicroSDカードによるストレージ拡張ができないことです。たとえ上位機種を購入したとしても、いずれはエクスポートしなければならなくなります。Plaud Noteなら64GBの標準ストレージを搭載しているので、この点でも決定的なアドバンテージがあります。
携帯電話にもAIが搭載されている

Galaxy AI。Apple Intelligence。Pixel 上の Google AI。これらのソリューションはどれも素晴らしい成果を上げます。しかし、時には失敗し、ステレオタイプな混乱を生み出したり、子供のお気に入りのアニメキャラクターをナチスの悪魔に変えてしまうことにためらいを感じたりします。さらに、これらの AI ソリューションは常に無料とは限らないという事実もあります。
しかし、もし私たちが公平な世界に住んでいて、ブランドが突然AIに慈善的な姿勢を見せるようになったと仮定してみましょう。AI、特にデバイス上で動作するAIは膨大な処理能力を必要とするため、AIの魔法をすべて実行するハードウェアを所有するだけでも、依然として高額な費用がかかります。そのため、Apple IntelligenceはiPhone 15 ProとPro Maxでしか利用できません。
Galaxy AIは、ハイエンドのSamsung製スマートフォンに限定されています。この状況は今年も、あるいは近い将来も変わらないでしょう。次世代AIをスマートフォンに搭載できるかどうかは、ブランドによる製品開発の決定だけでなく、入手可能なチップにも大きく左右されるからです。結局のところ、低価格スマートフォンに12GBのRAM(ローカルAIタスクのほぼ基本容量)を搭載することは期待できません。

アナリストによると、AIは確かにスマートフォンの売上を牽引するだろう。しかし、シリコンのパワーは、低価格のスマートフォンで高度なAI機能を実行できるレベルには達していない。しかも、アクセスに料金がかかるわけではない。Plaud Noteなら、どんなiPhoneやAndroidともペアリングでき、プロセッサのクロック速度を気にする必要もない。
代わりに、スマートフォンの背面にマグネットリングを取り付け、レザーケースを装着して録音ボタンを押すだけです。録音と文字起こしの量が月300分を超えない場合は、わずかなサブスクリプション料金を支払う必要もありません。
Plaud Note を購入すべきでしょうか?

今のところ、比較的最近のフラッグシップモデルをお持ちならPlaud Noteは必要ありませんが、そうでない方には実用的なニーズを満たす充実したソリューションです。iOS 18では、ネイティブの通話録音・文字起こしシステムが導入されました。これらの録音は自動的にメモアプリにインポートされるため、お使いのスマートフォンがAIツールキットに対応していれば、Apple Intelligenceのライティングツールを使って要約したり、書き直したりすることができます。
一方、GoogleはPixel 9から、ついに米国でネイティブ通話録音機能の提供を開始しました。Googleはこれを「Call Notes」と名付け、分析、文字起こし、翻訳のためにデバイスに搭載されたGemini Nano AIを搭載しています。ただし、これらの機能は現時点ではまだ一部のスマートフォンでのみ利用可能であることにご注意ください。また、プラットフォームに関わらず、これらのAI機能は永久に無料とはならない可能性があります。

一言で言えば、スマートフォンへの忠誠心には高い代償が伴うということです。それ以外の点では、Plaud Noteは信頼性の高いオールインワンソリューションです。文字起こしもかなり上手く、AIを活用して意味のある形式に変換し、きめ細かな共有機能やエクスポート制御も備えています。
Plaud Noteが「アプリでもよかったのに」という懐疑的な意見を凌駕しているのは、ハードウェアとソフトウェアの総合的なスタックと、それらが提供する利便性の高さです。そして、Plaudのようなスタンドアロンの録音・書き起こしソリューションを待ち望んでいた人にとって、そのような議論はどちらにしても無意味です。Plaud Noteの売上高はすでに1,000万ドルを超えており、購入を希望するニッチな層が確実に存在すると言えるでしょう。
