最近では、ChatGPT は数え切れないほどのユーザーにとって欠かせない日常の相棒となり、時事問題に関係なく、どんな質問にも答えることができる多用途のパーソナル アシスタントとして機能しています。 OpenAI は、Siri の日常的な Web 検索応答に疲れている人々の間で ChatGPT が好まれる選択肢となるよう準備された XNUMX つの画期的な機能を発表しました。 Googleのアシスタントは、挑戦的な質問に直面して沈黙を続けるもどかしい発作です。
OpenAI の最新の発表は、ChatGPT モバイル アプリに革新の波をもたらします。 iOS と Android デバイス。 最初の機能強化では音声インタラクションが導入され、ユーザーがこの人工知能の強力なツールと音声で会話できるようになります。 しかし、それだけではありません。XNUMX 番目の機能は、ChatGPT に画像認識機能を装備し、そのレパートリーをさらに拡大します。
ChatGPT の可能性を解き放つ:
これらの進歩がどのように機能するかを理解するために、OpenAI は、次のサイトで暴露ビデオをリリースしました。 Twitter、画像認識機能の動作を紹介します。 デモンストレーションでは、ユーザーは自転車のシートを調整するためのガイダンスと、その作業に必要なツールをすべて画像を通じて伝えます。
OpenAI は、スマートフォンのカメラで撮影したオブジェクトを説明することで視覚障害者を支援するように設計されたモバイル アプリである Be My Eyes と同様のテクノロジーを活用しています。 視覚認識と ChatGPT のニューラル ネットワーク間のこの相乗効果により、より多くのユーザーがこの新しい機能を採用するにつれてエラーが減少することが期待されます。
他にはない声:
音声対話に関しては、ChatGPT は、プロの声優によって細心の注意を払ってトレーニングされたオープンソースの音声認識システムである Whisper を採用しています。 その結果、既存の仮想アシスタントに関連する合成音とはまったく異なる、信じられないほどリアルで自然な音声が得られます。
写真、スクリーンショット、さらには本の画像内の幅広いオブジェクトを認識できるこの二重機能は、AI テクノロジーが提供する無限の可能性を垣間見ることができます。 これらの機能は、私たちの日常生活に欠かせないツールとなるでしょう。
アクセス可能かつ期待されるもの:
OpenAI はサーバー更新を通じてこれらの機能強化の展開を開始しており、月額 20 ドルを支払う ChatGPT Plus 加入者は今後 XNUMX 週間以内に完全にアクセスできるようになる予定です。 エンタープライズ プランのユーザーも、これらの魅力的な機能にアクセスできます。
OpenAIはこれらの機能強化を将来的に無料で提供する計画をまだ明らかにしていないが、それらが競合他社を圧倒し、ほとんどのユーザーの目にはSiriとGoogleアシスタントが後回しにされる可能性があることは否定できない。 AI を活用したパーソナル アシスタンスの未来が到来し、ChatGPT がその最前線に立っています。