ChatGPTはAIの洪水の扉を開きました。しかし、多くの人は、AI生成ツールやアプリケーションの世界が、探索されるのを待っていることに気づいていません。
ライターズブロックを乗り越えるのに苦労している場合でも、想像力をうまく表現する芸術的才能が不足している場合でも、あるいは単に効率的なコンピューターコードを手作業で作成する必要がある場合でも、生成型AIは、仕事とクリエイティブの両方の取り組みを強化し、効率化するのに役立ちます。しかし、現在提供されているAIアシスタントの種類は無限大に思えるため、ニーズに合ったものを見つけるのは容易ではありません。そこで、最高のAIチャットボット、最高のAI画像ジェネレーターなど、イノベーションの限界を押し広げる、最も優れたAIツールをいくつか詳しく見ていきましょう。
おすすめ動画
画像生成に最適なAIツール
旅の途中

2022年にリリースされた最初のAI画像生成ツールの一つであるMidjourneyは、ユーザーと美術評論家の間で絶大な人気を博しています。自然言語のテキストプロンプトに基づいて、無数の芸術的スタイルで高解像度かつフォトリアリスティックな画像を出力できます。
当初は同社のDiscordサーバーでのみ利用可能だったMidjourneyは、現在では簡素化されたウェブポータルからアクセスできるようになりました。ウェブサイトで生成されたアートのギャラリーは無料で閲覧できますが、独自の画像を生成するには月額サービスプラン(10ドルから120ドル)に加入する必要があります。
表意文字

Midjourneyほどクリエイティブな機能は豊富ではありませんが(5つのプリセットされたアートスタイルのいずれかでしか画像を生成できません)、Ideogramは1日に最大40枚の画像を生成できる寛大な無料プランを提供しています。有料プランは月額7ドルから48ドルで、追加のコンピューティングリソースやフル画質画像ダウンロードへの優先アクセスなど、多くの特典が提供されます。同社はまた、iOSアプリとAPIも提供しており、「他社製品と比較して低コストで優れた画質を提供する」と謳っています。
ダル-E 3

これはOpenAIが独自に開発したテキスト画像生成ツールで、同社のGPT-4モデル上で動作します。2023年9月にリリースされた当初は有料プランの加入者のみが利用可能でした。OpenAIは今年8月に無料プランのユーザーにも利用可能範囲を拡大しましたが、無料プランでは1日に2枚の画像しか生成できません。Dall-E 3は、MicrosoftのCopilotチャットボットからも利用可能です。
画像3

ChatGPTのような厳しい生成制限なしで高品質な画像を作成したい場合は、GoogleのImagen 3がおすすめです。Geminiチャットボット(無料版を含む)から利用可能で、以前のバージョンよりもアーティファクトが少なく、より高品質な出力を提供します。ただし、Gemini Advanced(月額20ドル)に加入しない限り、有名人であろうとなかろうと、人物画像は生成されない点にご注意ください。
グロク2

フレーム付き第3世代アルファ

RunwayのGen 3 Alphaは2024年6月にリリースされた比較的新しいモデルで、ユーザーの自然言語プロンプトに基づいて、ほぼ写真のようにリアルな静止画と動画クリップを作成できます。同社は最近、Gen 3プラットフォームに「Frames」と呼ばれる新しい基盤モデルの統合を開始すると発表しました。このモデルは、画像作成プロセスをこれまでにないほど細かく制御できるため、ユーザーは35mm使い捨てカメラのショットやレトロアニメのモチーフを模倣するなど、特定の美的スタイルを維持しながら、複数の画像バリエーションを生成できます。サブスクリプション料金は月額12ドルから76ドルですが、限定的な無料プランも提供されています。
画像編集に最適なAIツール
ルミナー ネオ

SkylumのLuminar Neoは、プロの写真家向けに設計された写真編集スイートです。Adobe Photoshopと同等の強力なツールを多数備えていますが、その機能の多くはAIにアウトソーシングされています。これにより、カラーバランスや照明レベルの調整から、空、水、肌の色合いの微調整まで、数多くの一般的なタスクをワンクリックで実行できます。Luminar Neoは、年間サブスクリプションで421ドル、生涯サブスクリプションで577ドルと、一般ユーザーには少し高価かもしれません。WindowsとMacの両方で利用可能で、Photoshop、Photoshop、Lightroom用のプラグインも提供されています。
Canvaプロ

Canvaは、デジタルホワイトボード、データビジュアライゼーション、マーケティング資料テンプレートから、写真、動画、YouTubeの編集機能まで、あらゆる機能を備えた多機能クリエイティブプラットフォームです。サイトの無料エディターを使用して、切り抜き、フィルターの追加、アスペクト比の調整などの細かい調整を簡単に行うことができますが、Canva ProではAIを活用した追加のツールが多数提供されています。
画像内の個々のオブジェクトを選択、移動、サイズ変更、さらには消去したり、平坦化された画像からテキストを抽出・修正したり、画像の背景を自動で拡大したり、これらはすべて数回のクリックで行えます。Canva Proのシングルユーザーライセンスは年間120ドルです。
Pixlr スイート

このオンライン写真編集スイートは、2008年のリリース以来、Photoshopに代わる無料かつ使いやすい代替ソフトとして活躍してきました。昨年11月には、画像生成、ジェネレーティブフィルツール、AI背景除去、AI顔スワップ、画像拡大といったAI機能を新たに追加し、ツールセットの機能を充実させました。インターフェースはカジュアルユーザー向けで、Photoshopほど精密で繊細な操作性は劣るものの、無料という点では群を抜いています。
トパーズフォトAI

画像の軽いレタッチ作業だけが必要な場合は、Topaz Photo AIスイートが8つの補正ツールを提供します。ノイズ除去、シャープネス、アップスケール、顔の復元、オブジェクトの削除、テキストの保持、照明の調整、カラーバランス調整です。Photoshopのようなフル機能の写真編集ソフトの完全な代替品ではありませんが、年間サブスクリプションなしで、定額199ドルでご利用いただけます。バージョンアップは99ドルです。
ホタルAI

AdobeのFirefly AIは、テキストプロンプトから画像や動画を生成するだけでなく、Adobe製品エコシステム全体の様々なAI機能を強化します。これには、PhotoshopのGenerative Fillツール、Adobe Expressのテキストエフェクト、Illustratorのベクターおよびパターン生成、Premiere ProのGenerative Extendなどが含まれます。これらの機能にアクセスするには、AdobeのCreative Cloudスイートに加入する必要がありますが、個別に購入することもできます(例えば、画像ジェネレーターは月額5ドル、Photoshopは月額23ドル)。また、20以上のAdobeアプリをすべて月額60ドルで購入することもできます。
ビデオ生成に最適なAI
ルマドリームマシン

Luma Dream Machineはファッション、マーケティング、映画制作のプロフェッショナル向けに設計されていますが、一般ユーザーとプロフェッショナルユーザーの両方を想定したサブスクリプションベースのサービスとして構築されています。従来のAIツールとは異なり、Dream Machineは目的の効果を生み出すために正確で詳細な指示を必要とせず、ユーザーの自然言語によるリクエストを直感的に解釈します。また、複数画像の指示や単一画像のキャラクター参照にも対応しているため、ユーザーはAIに思い描いたイメージを伝えることができます。Lumaには無料プランはありませんが、「趣味」ユーザー向けのサブスクリプションは月額わずか10ドルです。
クリング

中国Kuaishou TechnologyのAI動画生成システム「Kling」は、OpenAIのSoraに匹敵するフォトリアリスティックな出力を実現し、既に世界中のユーザーに提供されています。最大2分(Soraの2倍)、最大30フレーム/秒、720p(Soraの1080pよりわずかに低い)の高解像度動画を生成できます。各クリップの長さは5秒から始まりますが、追加クレジットを購入することで4.5秒単位で延長できます。ただし、政治的にデリケートなテーマは生成できない点にご注意ください。
シンセシア

Synthesiaは、これまで紹介した他の動画生成ツールよりもややニッチなツールです。ユーザーのテキストプロンプトから動画アバターを生成することに特化しており、オンボーディングやトレーニング動画、営業プレゼンテーション、社内コミュニケーションなどのビジネス用途に最適です。ユーザーは、140以上の言語を話す130種類以上のアバターモデルと、60種類以上の動画テンプレートから選択できます。無料プランでは、毎月3分間の動画1本と9種類のアバターを作成できます。月額30ドルのスタータープランと月額90ドルのクリエイタープランでは、さらに多くの特典が提供されます。
ヴィヨンド

VyondはSynthesiaと同様の機能を提供し、ユーザーのテキストプロンプトに基づいてトレーニングビデオ用のAIアバターを生成しますが、このサービスは実写の俳優ではなくアニメーションキャラクターを使用しています。また、特定のアクションや動きを録画するオプションもあり、Vyondはそれに合わせてアニメーションをモーションマッチングします。プランは月額49ドルからで、追加のビデオエディターへのアクセスも含まれますが、このプランで制作した動画にはVyondのロゴが透かしとして表示されます。
テキスト生成に最適なAI
チャットGPT

2022年のAIブームの火付け役となったチャットボット、ChatGPTは、推定週2億人のアクティブユーザーを抱え、今も業界の最前線を走り続けています。ウェブサイト、書籍、ソーシャルメディアの投稿、ニュース記事など、膨大な量の文書コンテンツで学習したChatGPTは、クリエイティブな文章を生成する能力に加え、一般的な知識に関する質問への回答やコンピューターコードのコンパイルにも長けています。また、ChatGPTは、高度な音声モードで会話機能を提供する初のチャットボットでもあり、ユーザーはまるで人間であるかのようにチャットボットと対話できるため、テキストベースのプロンプトは不要です。
ChatGPTはWeb、iOS、Androidで利用可能です。無料でご利用いただけますが、月額20ドルのChatGPT-Plusプランにご加入いただくと、同社の最新のAIモデルと機能にさらにアクセスできるようになります。
副操縦士

Copilotは、「ChatGPTがMicrosoft 365アプリエコシステム内でネイティブに動作したらどうなるだろうか?」という問いに答えます。そして、まさにそれが実現します。MicrosoftはOpenAIの事業に数十億ドルを投資しており、Copilot AIはOpenAIのGPT-4o LLM上で動作します。
しかし、CopilotはChatGPTの単なるスキン変更版ではありません。ChatGPTのように、Copilotではプレミアムプランに加入しない限り画像生成が制限されません。また、その機能はMicrosoft製品全体に統合されており、Wordでテキストを生成したり、Excelでグラフや表を作成したり、Outlookでメールを下書きしたりといった作業を容易にします。
Google ジェミニ

Googleのチャットボット「Gemini」は、2月の正式デビュー当初は少々波乱含みだったものの、このAIアシスタントはChatGPTとほぼ同等の機能と特徴を備え、急速に強力なライバルへと成長しました。テキスト、画像、動画、音声、コードの生成、Gemini Liveを使ったユーザーとの音声会話、Google Workspaceアプリスイートとの連携など、様々な機能を備えています。Gmailでメール返信を作成したり、Googleドライブでファイルを検索したり、スライドのコンテンツを作成したり、Googleドキュメントでテキストを下書きしたり、これらはすべてユーザーの自然言語プロンプトで行うことができます。
Gemini は無料で使用でき、Web 上だけでなく、iOS および Android アプリからも利用できます。ただし、AI のより高度な機能 (および Workspace 統合) にアクセスするには、同社の月額 20 ドルの Google One AI Premium サービスに加入する必要があります。
困惑

PerplexityのAIアシスタントは、従来の検索エンジンに代わるユニークな選択肢を提供します。Google検索のようにユーザーのクエリに対してウェブサイトのリストを返すだけでなく、このチャットボットはインターネット上で関連情報を検索し、ユーザーの質問に対する回答をチャットウィンドウに直接表示します。これにより、必要な情報を見つけるために個々のウェブサイトをクリックする必要が実質的になくなります。
GPT-4モデル上に構築され、Android、iOS、そしてウェブ上で利用可能なPerplexityは無料でご利用いただけます。同社は月額20ドル(または年額200ドル)のProサブスクリプションプランも提供しており、GPT-4 Omni、Claude 3 Sonnet、Haikuなどの追加AIモデルへのアクセスに加え、多数の追加特典もご利用いただけます。
碧玉

ChatGPTやGeminiのような汎用的なチャットボットとは異なり、Jasper AIはビジネスに特化したAIです。メール、ブログ、ソーシャルメディアの投稿、マーケティング資料用のテキストを生成するように設計されており、企業独自のトーン、ボイス、ブランドスタイルを維持します。このプラットフォームには、リサーチタスクの支援やライティングアドバイスの提供、マーケティングコンテンツのSEOスコアの最大化を支援するJasper Chatが含まれています。Jasperはサブスクリプション方式のみで提供されており、プランはユーザー1人あたり月額40ドルからですが、7日間のトライアルも提供されています。
オーディオと音声生成に最適なAI
イレブンラボ

ElevenLabsは、機械に言葉を話させる方法を熟知しています。同社は生成音声技術のリーダーであり、自動音声ダビングやクローン作成から、テキスト読み上げやテキストからSFXへの変換まで、音声を中心とした様々なサービスを提供しています。ユーザーは、パブリックドメインおよびライセンスデータに基づいてトレーニングされた、32言語で数千種類もの音声(著名人を含む)から選択できます。ポッドキャスト、オーディオブックのナレーション、会話型AIアプリケーションに最適な同社の製品は、無料から月額99ドルまで、幅広い価格帯で提供されています。
スピーチファイ

Speechifyなら、4.5倍の速さで文書を読み上げてくれるので、わざわざ読む必要はありません。同社の音声読み上げ技術は、提示したほぼあらゆる文書を、60以上の言語で200種類の音声(音声複製機能で自分の声も含む)から選んで読み上げることができます。Speechifyは、Chrome拡張機能、Macアプリ、ウェブアプリ、iOSアプリ、Androidアプリとして利用できます。モバイルアプリでは、スマートフォンのカメラでページをスキャンして紙の文書を読み上げることもできます。Speechifyの無料プランでは、10種類の音声によるシンプルな音声読み上げ機能のみ利用可能ですが、月額12ドルのプレミアムプランでは、サービスの全機能を利用できます。
演説者

Respeecherは、著名人、コンテンツクリエイター、声優、ゲームデザイナー、その他プロフェッショナル向けアプリケーションにおける音声複製を専門としています。同社のAIモデルは、基本的にある人物が別の人物の声で話すことを可能にします。RespeecherのFAQには、「『ターゲットの声』(複製する声)を録音し、システムをトレーニングして、『ソース話者』(セリフを読む俳優)に適用します」と説明されています。「本物の人間の声のあらゆる感情、イントネーション、ニュアンスを再現します。」
同社は、クリス・ファーレイやリチャード・ニクソンなど、幅広い著名人の声を提供しており、後者は2019年にSpeechifyにエミー賞をもたらしました。サブスクリプションプランは、基本的な音声合成(月間最大10万文字)で月額18ドルから始まり、900分の音声合成と100種類以上の声と13のアクセントで300万文字の音声合成生成を提供するパワー層では月額最大500ドルです。
音声制御

ミュージシャン志望だけど、音程が取れないという人は、Controlla Voiceが役に立ちます。この生成モデルは、15~30分のサンプル音声に基づいて、あなたによく似た「AI歌声」をトレーニングし、Controlla Voiceの豊富な楽曲カタログに適用したり、ライセンス契約を結んだ声優陣とあなたの声を融合させて、個性的なボーカルを生成したりすることができます。他のアーティストの既存曲のボーカルをあなたの声に変換して、簡単にカバーすることも可能です。サブスクリプション料金は月額12ドルから30ドルです。
コーディングに最適なAI
クロード

AnthropicのClaudeチャットボットは、画像を生成したり会話形式で話したりすることはできませんが、アプリケーションのコーディングに関しては非常に優れています。最新版のClaude 3.5 Sonnetは、業界をリードする様々なベンチマークにおいて、Gemini 1.5 ProやChatGPT-4oといったツールをはるかに凌駕する性能を誇ります。Claudeはまた、チャットストリーム外でAIが生成している内容をプレビューできる共同作業ウィンドウ(Artifactsと呼ばれる)を提供する初のチャットボットでもあります。このチャットボットはWeb、iOS、Androidですべてのユーザーに無料で提供されていますが、月額20ドルのProプランまたは月額30ドルのTeamsプランに加入すると、Anthropicが提供する最新かつ最高のモデルに優先的にアクセスできます。
GitHubコパイロット

GithubとOpenAIのパートナーシップにより開発されたGitHub Copilotは、AIオートコンプリートとして機能し、Visual Studio Code、Visual Studio、Neovim、JetBrainsの各IDEユーザーが独自に行うよりも高速にコードを生成できるよう支援します。ユーザーは自然言語でコーディングの問題を提示することでCopilotアシスタントが自動的に解答コードを生成します。また、指定されたコードスニペットの動作を解説したり、様々なコーディング言語間でスニペットを変換したりすることも可能です。Github Copilotは無料でご利用いただけますが、月額4ドルのProプランまたは月額21ドルのEnterpriseプランにアップグレードすると、追加のリソースと機能が利用できるようになります。
Amazon コードウィスパラー

Copilotと同様に、AmazonのCodeWhispererは汎用的なコーディングアシスタントで、既存の入力に基づいてリアルタイムで自動的に提案やコードの推奨事項を生成します。JetBrainsとVisual StudioのIDEで利用可能で、Macのコマンドラインでは自然言語からbashへの翻訳もサポートしています。無料版ではシステムの高度な機能へのアクセスが制限されているため、フル機能を利用するには月額20ドルを支払う必要があります。
カーソルAI

Cursor AIはCodewhispererと同様のコーディングアシスタントですが、以前の入力内容に基づいて、複数行のコードにまたがるオートコンプリート候補を表示できます。また、タイプミスや構文エラーを自動的に修正するスマートリライト機能も備えているため、デバッグ中に誤った引用符や括弧を探す時間を短縮できます。さらに、カーソル予測機能により、次にカーソルをどこに置くべきかを予測し、プロジェクトをより迅速かつ効率的にナビゲートできます。
さらに、アクティブなファイル全体または特定のコードブロックに関する質問に答えるチャットボットアシスタント(GPT-4、GPT-4o、Claude 3.5 Sonnetを活用)も提供しています。チャットボットは、自然言語による指示に基づいて、ハイライト表示されたコードを編集することもできます。Cursor AIはMac、Windows、Linuxオペレーティングシステムで利用可能です。2週間無料でお試しいただけます。その後は、月額20ドルのProプランまたはユーザーあたり月額40ドルのBusinessプランへのアップグレードが必要です。
アプリエコシステム全体と統合できる最高のAI
メタAI

Facebookの親会社であるMetaは、ここ数年AIに多額の投資を行っており、最近ではGeminiやCopilotといった競合製品に搭載されているスマート機能を自社製品ポートフォリオに組み込み始めています。「Meta AIは毎月4億人以上が利用しており、毎週1億8500万人が当社の製品全体で利用しています」と、同社は9月のブログ投稿で誇らしげに述べています。
同社は現在、Messenger、Facebook、WhatsApp、Instagram DMで、高度な音声モードに似た会話型AIを提供しています。グループチャットで共有された写真に関する質問に答えたり、フィードからInstagram Storiesに再共有した画像の背景をカスタマイズしたり、Instagram Reelsの音声を自動翻訳したりできます。また、フィードやストーリーで共有する画像や、Facebookのプロフィール写真として設定する画像も生成できます。FacebookやInstagramになぜこれほど多くのAIが溢れているのかと疑問に思うかもしれませんが、これはMetaが数十億ドルをかけて開発した機能であり、バグではないことを理解してください。
365コパイロット

MicrosoftはOpenAIとの提携に100億ドル以上を投じているため、ChatGPTの自動生成機能を可能な限りあらゆる製品に組み込むのは当然のことです。Copilotチャットボット本体に加え、MicrosoftはClaude's ArtifactsやChatGPTのCanvasに似た機能を持つCopilot Pagesを開発・リリースしました。また、Outlookにも統合されており、どのメッセージに最初に返信するかを優先順位付けしたり、返信メールを素早く作成したりすることで、受信トレイの管理を支援します。
365 Copilot は、自然言語プロンプトから一貫したトーンとブランドボイスを維持したピッチデッキを一から生成することで、PowerPoint プレゼンテーションで一貫性のあるストーリーを迅速に構築するのに役立ちます。Excel では、Copilot がユーザーのプロンプトに基づいて数式、グラフ、チャートを生成するという重労働を担います。また、Teams では、Copilot がビデオ会議を監視し、会議の内容を要約するだけでなく、議論内容に基づいて実行可能な項目リストも生成します。
Google ジェミニ

Geminiは、MicrosoftのWorkspaceアプリスイートにおけるCopilotの機能に相当する機能をGoogle Workspaceアプリスイートで提供します。このAIアシスタントは、Gmailでのメールの下書き、Googleドキュメントでの文書作成、スプレッドシートでのグラフやチャートの作成、スライドでのスライドの作成と修正、ドライブでのファイルの検索、Meetでのリアルタイム翻訳による字幕の提供とメモ作成などを支援します。個人用のGoogle One AI Premiumサブスクリプションにまだ加入していない場合は、Workspace管理者にアクセス権限を付与してもらう必要があります。
アップルインテリジェンス

Apple IntelligenceはAI分野では新参者かもしれませんが、現在市場に出回っているどのAIよりも、Apple製品エコシステムへのより深い統合を約束しています。ユーザーに代わって行動する包括的なエージェントとして設計されており、単調な日常業務を効率化し、Siriをより優れた会話相手にし、Appleの無数のアプリにおける校正とテキスト要約を自動化し、超高速の画像生成を実現するとされています。現在、iOS 18、iPadOS 18、macOS Sequoiaを搭載したすべてのデバイス、つまりiPhone 15 Proと15 Pro Max(およびそれ以降)、そしてM1以降のチップを搭載したiPadとMacで利用可能です。