【OpenSea】nagiblog みてね!

【ChatGPT】友達や家族のように会話が可能に。音声・画像機能で見る/聞く/話す。iPhone(iOS) Androidでも視覚と音声でのコミュニケーションが始まる

OpenAIのChatGPTに追加された新機能についてお話ししたいと思います。

最近、ChatGPTは音声と画像の新しい機能を導入しましたので、これで私たちユーザーは音声での会話ができるようになり、ChatGPTに話題の写真を見せることもできますよ!

本記事では、公式サイトと、これまでChatGPTや画像生成AIを使ってきた体験をもとに新しいChatGPTの機能を解説していきますね

目次

ChatGPTの新機能の概要


新しく加わった音声と画像の機能によって、ChatGPTは更に直感的に使いやすくなりました。

旅行中に素敵なランドマークの写真を撮ってChatGPTに見せたり、冷蔵庫の中の食材を撮影して、夕食のメニューを一緒に考えることもできます。

ChatGPTのこの機能によって、ショッピングから料理の準備まで、日常生活のあらゆる局面で役立ち、ユーザーの生活がより便利かつ豊かになります。

画像を認識して情報をくれるだけなら、Googleレンズでも出来たけど、そこから会話しながら情報をさらに得れるってスゴイね

便利なだけじゃなく、楽しそう

ChatGPTと音声で会話し、返事を返してもらえます

音声を使用してChatGPTと、お友達とやり取りしている様に会話ができるようになりました。

音声機能を利用すると、ユーザーはChatGPTとの対話を音声で行うことができ、外出先でも話しかけたり、就寝前の子どもたちに絵本を読むように話したり、夕食のテーブルでの議論を解決したりできます。


この機能は、新しいテキストツースピーチモデルによって支えられており、人間のような音声を生成できるようです

OpenAI公式サイトより 

公式サイトのサンプル動画は英語の会話でしたので、字幕を付けておきました

OpenAIはプロの声優と協力して、各声を作成している様です

ChatGPTの話す音声には、たくさんの良い点があるけれど、ちょっと注意が必要な機能でした。

AIボイスチャンジャーなどのAIボイスは、悪用する気になれば、これを使って友達や有名人のふりをしたり、嘘をついて人を騙したりすることが出来てしまうからです

なので、OpenAIも安全に使ってもらうために、特定の場面だけでこのテクノロジーを利用している様です

例えば、音声チャットの品質を向上させるために、このテクノロジーを使っています。

OpenAIとビジネスパートナーの声優さんたちと一緒に仕事をして、リアルな声を作り出しているんですよ。

他の会社も同じように、このテクノロジーと協力しています。

Spotifyは、この技術を利用し、音声翻訳機能のテストを実施しています。

ポッドキャスターは、この機能を使うことで、自分の声で色んな言語に翻訳でき、もっとたくさんの人に自分の話を届けることができます。

この新しい機能はすごいけど、正しく安全に使うことが大切なんですね

ChatGPTの新しい画像認識と会話機能

新しい画像機能を利用すれば、ユーザーはChatGPTに対して1枚、またはそれ以上の画像をアップロードすることが可能となります。


これにより、グリルが始動しない理由をトラブルシューティングしたり、冷蔵庫の中身を探索して食事を計画したり、仕事関連のデータのために複雑なグラフを分析したりできます。

画像の特定の部分に焦点を当てるには、モバイル アプリの描画ツールを使用できます。

OpenAI公式サイトより

2つめの写真を伝える時に、1つ目の写真を覚えている様に回答しているね

より詳しいトラブルシューティングをしてくれそうですね

スマートフォンでの使用方法 iPhone(iOS) Android

まず、写真ボタンをタップし、画像をキャプチャまたは選択してください。

iOS または Android を使用している場合は、最初にプラス ボタンをタップします。

複数の画像について話し合ったり、描画ツールを使用してアシスタントをガイドしたりすることもできます。

画像理解は、マルチモーダル GPT-3.5 および GPT-4 によって強化されています。こ

れらのモデルは、言語推論スキルを、写真、スクリーンショット、テキストと画像の両方を含むドキュメントなど、幅広い画像に適用します。

ChatGPTの新画像・音声機能は、いつから使える?使用条件は?

今後 2 週間かけて、2023年10月半ばころからChatGPT の音声と画像を Plus ユーザーと Enterprise ユーザーに展開していくと発表されています

音声は iOS iPhoneと Android (設定でオプトイン) で利用可能になり、画像はすべてのプラットフォームで利用できるようになります。

スマホで使った方が、誰でも簡単に音声と画像の機能を使えそうだね

因みに、普通にChatGPTを使う時と同じように英語の方が精度が高い様です

うちのおばちゃん、ChatGPTくんが友達とLINEしてるみたいで楽しいって言ってるから、会話が出来たらもっと楽しめそう

ChatGPTにDALL·E 3も加わり、画像生成AIも出来る様になるらしいから楽しみですね

本記事は、OpenAI社のXと、公式サイトの情報をベースに私のAI体験を踏まえ書かせて頂きました

人気ブログランキング参加中 応援してね

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね♪
  • URLをコピーしました!

web3 時代に必要なスキルを磨く!

なにかやりたい作業があって短時間で身に着けたいのであれば、オンラインで授業を受けたり質問できるサービスもあるよ

SHElikesは女性限定ですが、幅広く学べて、業界最安値(それでもそこそこなお値段しますが)

Withマーケは、私も参加してて、マーケティングに特化していまして、マーケティングスクールとしては最安値で、内容も濃くお値段以上です

副業に役立つツール・まとめ

副業に役立つツール最強ツールは、みなさんもご存じのAdobeのアプリ。

画像加工のPhotoshop 動画編集のpremiereなどでおなじみですが、単体プラン(2728円/月)を2つ以上契約するなら、全てのアプリを使えるAdobeクリエイティブクライド(6248円/月)がお得

さらに、社会人でも買えるアカデミック版(39980円/年 月当たり3,331円)は公式サイトのセール価格と同等価格のうえに、アカデミックの講義も付いてくるお得プラン

Adobe CCをアカデミック版で買うとセール価格より安い

副業に役立つ本まとめ

ブログで5億稼いだ方法/きぐち著

ブログサイト運営するなら、バイブル的な本です

なかなか知れない裏情報もばっちり載ってます

ブログ歴17年のプロが教える売れる文章術 ブログライティングの教科書/(中島大介)なかじ

現在、ブログ系の情報発信者のトップクラスのインフルエンサーです

私もなかじさんの情報にはかなり助けられました

目次