【AIツール比較】AIチャットボット・画像生成AI・動画生成AI・音声合成AI(読み上げ含む)・音楽生成AI

各評価に関して｜わかりやすいよう星の数で評価しています

★★★★★　仕事など場面問わず使えるAIツール

★★★★　　趣味以上で使えるAIツール

★★★　　　遊びで使えるAIツール

★★以下　　使えない

あくまで個人的見解です。

AIチャットボット
1. ChatGPT(チャットGPT)｜★★★★★
2. Bing AI(ビングAI)｜★★★★
画像生成AIツール
動画生成AIツール
音声合成AI・読み上げツール
音楽生成AIツール
生成AIの商用利用・著作権に関して

AIチャットボット

ChatGPT(チャットGPT)｜★★★★★

ChatGPTを使ってみる

ChatGPTにできること

文章を書いてくれる
AIとチャット
プログラムコードが書ける
登録後、無料で利用できる。有料版ならGPT-4も利用できる

Bing AI(ビングAI)｜★★★★

Bing AIを利用する場合、スマホならiOS、Androidアプリの対応する方をダウンロード、PCの場合はブラウザ「Edge」をインストールしてMicrosoftアカウントでログインしてからの利用となります。

iOSアプリ

Androidアプリ

Edge(PCブラウザ)

Bing AIにできること

複雑な検索ができる
文章を書いてくれる
AIとチャット
プログラムコードが書ける
無料で利用できる

文章で利用するなら使い勝手も考えChatGPT一択です。私は有料でGPT4も使ってますが、ガッツリ使わないのであれば無料のままで良いです。

画像生成AIツール

Stable Diffusion(ステイブル・ディフュージョン)｜★★★★

Stable Diffusionの使い方は「Webサービスを利用」「自分で環境を作る」の２つがあります。

最新「Stable Diffusion XL」はDreamStudioでベータ版として利用することができます(2023年4月27日現在)。

Stable Diffusion Web UI｜★★★★

Stable Diffusion Web UIを使ってみる

Stable Diffusion Web UIは導入難易度が高いですがアドオンの追加で機能が増します

Stable Diffusion Web UIできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
生成する画像のポーズを決められる
無料で使うことができるが、導入までのハードルが高い。

DreamStudio(ドリームスタジオ)｜★★★★

DreamStudioを使ってみる

dreamstudioにできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
無料登録で、25クレジットついてくる。使用後は、有料で追加して利用。

Mage(メイジ)｜★★★★

Mageを使ってみる

Mageにできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
無料でも無制限に使える。但し安全フィルターや複数の機能は有料版から。

Hugging Face(ハギングフェイス)｜利用していない

使っていないので詳細不明。

Midjourney(ミッドジャーニー)｜★★★★

Midjourneyを使ってみる

Midjourneyにできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
有料版にて商用利用できる

無料版が終了し、有料での利用のみとなったが生成されるクオリティは高い。

Leonardo.AI(レオナルドAI)｜★★★★

Leonardo.AIを使ってみる

Leonard.aiにできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
登録後、無料で毎日利用できる。生成枚数を増やしたい場合は有料版。

無料版で使える優秀な画像生成AIを探してるならおすすめ。但し、現在招待制のため、登録後利用できるまで10日ほどかかる（実体験で10日ほどかかりました）。

DALL·E 2(ダリ2)｜★★★★

DALL-E 2を使ってみる

DALL·E 2にできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
登録後、クレジットが与えられ、その範囲で無料利用できます。毎月１５クレジット追加されます。足らない場合は、有料でクレジットを追加して利用する。

にじジャーニー｜★★★★

にじジャーニーを使ってみる

にじジャーニーにできること

テキストから画像を生成（text to image）
画像から画像を生成（image to image）
(2023年4月27日時点)現在有料版のみの利用ができます。

画像生成AIに関しては、それぞれで得意分野が変わってきますが、特に無料or有料でどれを使うか決めると良いです。無料の場合でガッツリ使うなら「Stable Diffusion Web UI」。1日の枚数に限りがありますが「Leonardo.AI」も良いです。

有料であれば使い勝手とクオリティで「Midjourney」がおすすめです。

動画生成AIツール

D-ID(ディーアイディー)｜★★★★

D-IDを使ってみる

D-DIにできること

画像から喋っているかのような動画を作ることができる
無料登録で５分間の動画を生成可能。

声に合わせてまるで本当に喋っているかのうような動画を作ることができます。口だけでなく目や顔が自然な感じで動くのが素晴らしい。但し、言葉と口の動きが完全ではないため少しの違和感あり（私は日本語で試してます）。また、音声は外部で作ったものも使えます。課金しても良いレベルになっていますが、商用利用する場合、1月約50ドル(15分の動画の制作が可能)と高い。

Runway(ランウェイ)｜★★

Runwayを使ってみる

Runwayにできること

動画とテキストから新たな動画を生成
動画と画像から新たな動画を生成
動画とテンプレートからテンプレートに準ずる画像を作成
無料登録でクレジット付与されその範囲内なら無料利用可能。

正直、まだ生成されたものは使い道がないレベルのもの。Runway2が出るまでは使い方を覚えるために利用するぐらいがちょうど良い。

Kaiber(カイバー)｜★★★

Kaiberを使ってみる

Kaiberにできること

画像1枚を動画にすることができる
無料登録でクレジット付与されその範囲内なら無料利用可能。

正直、まだ生成されたものは使い道がないレベルのものですが、画像1枚を動画にできるのは素晴らしく、これが実用レベルになれば課金して利用したい。

Fliki(フリキ)｜★★★★

Flikiを使ってみる

Flikiにできること

テキストだけ入れると、それにあった動画が自動選択され動画を作成できる
無料登録で月5分までの動画を作成できる。

動画の生成というよりは、テキストに合った動画を素早く作れるツール。使えるが、クオリティが高いものは正直作れない。ただ、ブログを動画にするなら最短でできるから、今後の発展には期待している。あと、コスパは良くない。

動画生成AIは、正直まだ有料で使うべきではないと考えています。理由は生成されるクオリティが低いから。写真が喋っているような動画を生成する「D-ID」は使えますが、コスパが悪いです。

音声合成AI・読み上げツール

VOICEPEAK(ボイスピーク)｜★★★★★

VOICEPEAKを使ってみる

VOICEPEAKにできること

入力したテキストを読み上げてくれる
日本語に対応
有料ソフト

読み上げソフトとして優秀。限りなく人間に近い発音で日本語のナレーションを作ることが可能。感情に合わせて読み上げもでき、嬉しい声、悲しい声、怒った声などの表現が簡単にできる。ただ、全体の20％は手作業でイントネーションを変えないとbotっぽい読み上げになってしまう。
2万円以上と結構高いので、趣味で使うのは少し躊躇してしまうが、費用に見合った仕事はしてくれます。

CoeFont(コエフォント)｜★★★★

CoeFontを使ってみる

CoeFontにできること

入力したテキストを読み上げてくれる
ひろゆきの声など5,000種類以上の声の中から選んで作成できる
無料から利用可能だが制限あり。商用利用の場合は有料。

ひろゆきの声で作られた動画を見たことがあるかもしれませんが、実はこれで作成されてます。無料から利用可能であることがメリット。長文やアクセントも変えられ、人間が喋っている感じに近いものが作れるが、イントネーションなどで作られた声なのはすぐバレる。使い方によっては動画のナレーションとしても十分使えます。有料の場合は5,000種類以上の声から選んで作成ができる。

音読さん｜★★★★

音読さんを使ってみる

音読さんにできること

入力したテキストを読み上げてくれる
日本語、英語に対応した声を選んで利用できる
登録なしで無料でも利用可能だが、登録すると無料で使える文字数が増える。
無料から商用利用可能(無料利用の場合クレジット表記必須)

無料から利用できる読み上げソフト。ブラウザで登録なしでも利用できる手軽さが最大の特徴。日本語はイントネーションやアクセントなどで人間が喋っていないのはすぐバレるレベルだが、そこを気にしないのであれば色々な用途に活用できる。

ここについては以前からある読み上げソフトになってますが、お金が出せるなら「VOICEPEAK」がおすすめです。買い切りですが2万円以上かかるので躊躇すると思いますが、しっかり使えば元は取れます。

音楽生成AIツール

Mubert(ムバート)｜★★★★

Mubertを使ってみる

Mubertにできること

テキストから楽曲を作り出すことができる
イメージからでも楽曲作成可能だから驚くほど簡単に作れる
無料でも楽曲制作可能
商用利用は有料(Pro以上)

テキストでイメージを伝えることでBGMを作ることができるという素晴らしいAI音楽生成サービスのMubert。動画などのイメージを言葉で伝えることでBGMが簡単にできるのは最高だと思います。ただ、気に入った楽曲ができるかはできるまでわからないので、何らかBGMサブスクに加入しているなら無料で試す程度でいいかも。

SOUNDRAW(サウンドロウ)｜★★★★

SOUNDRAWを使ってみる

SOUNDRAWにできること

AIによって無数に生み出されるフレーズを組み合わせてBGMが作れる
楽曲の尺、構成、楽器、テンポを自由に変更できる
会員登録せず無料でもBGMを作ることは可能
ブックマークは会員登録が必要(無料でも可能)
ダウンロードして使用できるのは有料サブスク会員のみ

今まで動画で利用するBGMはサブスクサイトやフリー利用できるサイトのものを利用していたと思いますが、ここなら自分オリジナルのBGMを簡単に作ることが可能。商用で利用できるが、音楽を主とした利用については制限があり規約に従う必要がある。なおユーザーが作成したBGMの著作権は運営のSOUNDRAW株式会社。

AIVA(エイヴァ)｜★★★★

AIVAを使ってみる

AIVAにできること

素人でも使い方を覚えればBGM作曲が可能
非営利目的なら無料でもBGMを作れる
YouTube、Twitch、TikTok、Instagramのみで収益化できる有料プランあり
著作権をユーザーが所有し無制限に収益化できる有料プランもあり

一人で音楽制作が可能な驚きの音楽生成AIサービス。素人が使った感想としては、思ったよりも使い方がむずかしく、BGMができるまでは使い方を理解するのに時間がかかりそう。でも、有料プランによっては著作権をユーザー側が取得でき、無制限に収益化も可能なので、素人でも音楽を収入にすることが可能。

MusicLM(ミュージックLM)｜★

MusicLM

2023年1月下旬に発表のあった、テキストから音楽を生み出すAIモデル「MusicLM」。複雑な記述、テキストと鼻歌や歌声、楽器などメロディの両方を元に音楽を生成できるAI。下記理由でまだ使うことはできませんが、Googleから「text to music」ができるツールが出るなら一度は使ってみたい。

なお、現在の「MusicLM」には、著作権などの法律的な観点を含む「誤って流用される可能性があるというリスク」を孕んでいるとしており、Googleは一般公開を見送っています。
https://kai-you.net/article/85928

動画内で使うようなBGMであれば、音楽生成AIの使用はお勧めしません。理由はBGM商用利用できる他のサブスクの方が簡単に良いBGMが見つかるからです。

今、音楽生成AIを使うなら、作成した楽曲自体を販売することを目的にしている場合だけかなと思います。その場合、ここで紹介した音楽生成AIではAIVA(エイヴァ)のプロライセンス一択。

生成AIの商用利用・著作権に関して

商用利用可能かどうかは、それぞれのサイトにて再度各自でご確認ください。間違った記載があったとしてもこちらでは責任は負えませんので予めご了承ください。基本的には有料会員にならないと商用利用できない場合が多い印象です。

画像生成AIについては複雑で、Stable Diffusionのような商用できるものでも、生成する際に使うモデル・Loraによっては商用できないなどあります。簡単に理由を言うと、画像生成において著作権があるものを使って学習させた場合、訴えられる危険性があるため。

また、商用利用可能であったとしても、著作権はないものと思って利用した方が良いと思っています。理由は2023年3月アメリカで「AIで作られた個々の画像自体は著作権で保護できない」と結論付けられているからです。

In February 2023, the Office concluded that a graphic novel comprised of human-authored text combined with images generated by the AI service Midjourney constituted a copyrightable work, but that the individual images themselves could not be protected by copyright.

(和訳)2023 年 2 月、事務局は、人間が作成したテキストと AI サービス Midjourney によって生成された画像を組み合わせたグラフィックノベルは著作権のある作品を構成するが、個々の画像自体は著作権で保護できないと結論付けました。
https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence

まだ日本では訴訟は起こっていませんが、今後、AIのルール設定が追加されていきそうですね。