ソフトウェア開発者のための OSS、まとめてみました!

ソフトウェア開発を行なっている自分が、個人的に面白いと思ったプログラムの最新技術や、オープンソースソフトウェア(OSS)をまとめています!

MENU

ChatGPT と Azure の人工知能言語モデルを基に作成された話す ChatGPT!「Polyglot」

概要

ChatGPT が登場し社会に絶大なインパクトを与えて久しくないですが、今では様々な ChatGPT のサービス(OpenAI API を利用したサービス)が登場してきています。

aismiley.co.jp

openai.com

そんな中、また新たに ChatGPT に関連する面白い OSS を見つけましたので、ご紹介しようと思います。

今回ご紹介する OSS は、ChatGPT と Azure の人工知能言語モデルを基に作成された、話す ChatGPT「Polyglot」になります。

こちらの「Polyglot」ですが、多くの言語に対応しており、さらにデスクトップアプリとして利用することができる、なかなか素晴らしいアプリとなっています。

それでは早速詳細について見ていきましょう!

目次

特徴

こちらの「Polyglot」の特徴ですが、以下の点が挙げられていました。

  • 多言語対応
    • 英語、日本語、韓国語、フランス語、その他
  • 音声合成機能
    • Azure TTS サービスを利用
  • 自然な対話機能
    • ChatGPT(OpenAI API を利用)
  • ダークモードをサポート
  • テキスト翻訳機能

現在絶賛開発中ということもあるため、その他にも随時機能が追加されるようです。

気になった方は README からどのような特徴・機能があるかを確認してみると良いですね。

利用手順

利用方法としてはインストーラー経由で起動する方法と、リポジトリ経由で起動する方法があります。

インストーラ経由で利用する方法

インストーラ実行後、「Polyglot」が起動しますので、アプリ画面の「Setting」から OpenAI API キーを入力して利用ください。

リポジトリ経由で起動する方法

  1. リポジトリをクローン
   git clone https://github.com/liou666/polyglot.git
  1. pnpm を利用して必要なモジュールをインストール
   cd polyglot
   pnpm install 
  1. 環境変数ファイル名を変更
   mv .env.example .env
  1. ローカルサーバー起動 cmd pnpm dev

起動後はデスクトップアプリが起動しますので、OpenAI API キーを「Setting」から設定して利用ください。

使用感

早速私のほうでもこちらの「Polyglot」を利用してみました!

少し触ってみた感触としては、ChatGPT のように自然言語で AI と対話できるし、きちんと日本語にも対応していました。

チャット画面のほうにもありますが、AI 側の回答についてはきれいな音声・発音で話してくれますし、こちらの音声もマイク経由で入力することができたため、音声操作・返答が不自由なくできる ChatGPT という印象でした!

AI 側のアイコンを自分好みに変更できる点、名前も変更できる点、返答してくれる言語も変更できる点について、とても素晴らしいなと思いました!

個人的に気になった 2 点ありました。

1 つめはユーザーのアイコン変更ができなそうという点で、AI 側のアイコンを変更できるなら、ユーザー側のアイコンも変更できたらよかったなと思いました。

もう 1 点は AI が返答した内容を翻訳した文言の音声出力できなそうという点で、翻訳したメッセージの下にあるスピーカーマークを選択しても、デフォルトで設定した言語でした音声出力してくれないので、翻訳してくれたらなと思いました。

(下の図だと、翻訳機能で中国語に変換してくれているのですが、この状況でスピーカーマークを選択しても中国語でなく日本語の音声が出力されてしまうということです。)

ただ、「Polyglot」は本記事執筆時点でバージョンが「0.1.1」ということもあり、現在絶賛開発中です!

そのため、上記で気になった点も正式版時点では改善されていることだと思います。

個人的にはとても素晴らしいアプリだと思ったので、正式版まで気長に待ちたいなと思いました!

まとめ

今回は、ChatGPT と Azure の人工知能言語モデルを基に作成された、話す ChatGPT「Polyglot」という OSS についてご紹介しました。

ChatGPT を利用したサービスは現在も続々と開発され続けています。

その中でも音声入力・音声出力が高いレベルで可能、かつ多言語にも対応しているというこちらの「Polyglot」は、内容としても非常に素晴らしいサービスかと思います。

ChatGPT を音声入力・出力してみたいという方や少しでも気になった方は、ぜひこちらの OSSPolyglot」をインストールしてみて、動かしてみてはいかがでしょうか。

ライセンス

MIT License

リンク

github.com

github.com