こんにちは。デザイン部の坂能です。
1-10では以前から社員のスキルアップや技術開発などを目的とした「シード開発」という時間が設けられています。
そして更に今期からは「先行技術シード」という、特定の領域に関して興味を持った有志の社員が集まって研究内容や情報共有をするという、より組織的なシード施策が始まりました。
主にAI/XRを中心とした技術トレンドを常に追うことで今後のクライアント・案件獲得に繋げる目的があります。
その中でも私は生成AI技術に興味があり、様々なAI生成サービスの使用感を試したり、トレンドを追っていくことで商用利用・実務での活用の可能性・応用的な使い方などのナレッジを蓄積する目的で、デザイン部メンバーを中心としたメンバーで構成されている「AIジェネレーティブゼミ」にて、日々研究に勤しんでいます。
先行技術シードが始まってから月日が経ち、ある程度進捗を共有できる段階になってきたため、参加者を集めて月2回を目処にMTGを行うことになりました。
そこでは、技術研究や知見の共有、現状のAI生成技術において問題になっていることなどの議論を繰り広げています。
そして更に、MTGで議題に上がった内容を記事にして発信する運びとなりました。今回は以下のテーマを取り上げています。
「オートメモ」というAI議事録サービスを使用し、文字起こし〜要約まで挑戦してみました。
手動で議事録を取るのはかなり大変な作業になるので、それこそAIで議事録を起こせないか、このMTGで試してみる流れになりました。
※残念ながらMac PCではリモート非対応なので対面か、もしくはwindowsでの運用になります。
月1時間まででしたら無料で文字起こしが可能です。上記の件もあるので実用は難しいかもですが取り敢えず試してみます。
料金プランはこちら
音声ファイルを読み込めるか試してみました
動画のままだと読み込まなかったので、書き出しで音声だけ抽出してみますが、やはり読み込まず…そのため、少々手間ですが以下のやり方で再度録音して試してみます
オートメモを使った文字起こしの方法
1.MTGの音声を再生
2.オートメモに録音する
3.自動的にテキスト化される
大体のAI議事録ツールはファイルを読み込むのではなく、リアルタイムで録音したものを音声化するものがかなり多いので、その場で録音して運用するのが良さそうです。
(録音済みのものを読み込めるのはpro版か、議事録というよりはただ文字起こしするだけのツールになってしまいそうです)
ツール上でMTGの画面共有をONにすれば、録音と共に文字起こしが開始されます
画像の通り、会話ごとに音声が保存されました
要約ボタンをクリックで、MTGの内容をわかりやすくまとめてくれます。
以下要約した内容を掲載しました。
テキストデータをそのままDLできるので簡単にコピペ可能です。
【要約】 今回の会議では、メンバーの参加タイミングや会議の頻度について議論が行われました。 具体的には、2週間に1回か、毎週1回の頻度で会議を行うことが提案されました。 また、初回の会議について、進行役の高野さんの進行に対する評価が述べられました。
【決定事項】 会議の頻度については、一旦各自のスケジュールを確認し、その結果に基づいて決定することになりました。 また、次回の会議ではステータスレポート(SR)の作成について話し合うことが決定されました。
【共有事項】 会議の進行役を務めた高野さんの進行について、良かったとの意見が共有されました。 また、次回の会議でステータスレポート(SR)の作成について話し合うことが共有されました。
話者ごとの要約
E :AIを使ったイラスト制作について議論し、その著作権問題や商用利用についても触れた。 AIが生成したイラストの肖像権や参考にした元のイラストの権利問題がグレーゾーンであること、また、AIを使ったイラスト制作は技術として捉えるべきであるとの意見が出た。 また、MidJourneyとGPTを用いたイラスト制作の流れを具体的に説明し、その中で試行錯誤しながら最適な結果を得る方法についても触れた。 最後に、AIを使った議事録作成についても話し合い、その可能性について語った。
C :スピーカーは、文章を4つのシーンに分けて演じることを提案しました。 また、生成するためのプロンプトテキストを英語で求め、テイスト系の内容が生成されると予想しました。 人を小さくする、他のアングルから見るなどの要求も提出しました。 しかし、特定の部分は使わないようにと提案しました。 ・最後に、一部のツールは使えないと述べ、会議を終えました。
A :議事録のまとめと先行技術シートのスプレッドシート、PDFの資料を共有し、課金ルールもまとめた。 AIを用いて議事録を作成する可能性を提案し、そのテストを行うことを提案した。 また、デザインユニットで議題を作成し、AIでキャラクターを作成するアイデアを提案した。 今後のミーティングでは、これまでの研究や調査結果を報告することを提案し、特定のメンバーに画面共有を依頼した。 最後に、AIの技術進歩について議論し、その影響について意見を交換した。
D :スピーカーは、AIによる画像生成とレコメンドサービスについて議論しました。 特に、アニメ風のイラストを生成し、それを選択肢として提供することで、ユーザーに最適な選択をさせるという提案を行いました。 また、商用可能なイラストの生成や、精度の高いAIの選定についても意見を求めました。 さらに、自身のオリジナル素材を混ぜることの可能性についても触れ、その有用性を認めました。 最後に、議事録作成における特定の発言者の特定についても問いかけました。
B :スピーカーは、録画を文字起こししてYouTubeに非公開でアップロードする方法について語り、画像が撮れない問題について触れた。 また、商用利用とAI画像生成の学習モデルの問題、特に著作権問題について議論した。 スピーカーは、AIで生成した画像データの品質と著作権の問題についても触れ、自分が描いたオリジナルの絵をAIに学習させることの安全性を提案した。 最後に、スピーカーは自身がステーブルディフュージョンを早期から使用していた経験と、その使用方法について詳しく説明した。
F :AIが生成した画像をそのまま使用する場合の権利について議論しました。 AIが生成した画像はそのまま使用できない可能性があるとの見解を示しましたが、自分の考えや何かしらの要素を加えて調整すれば、権利問題は関係なくなると提案しました。 また、AIが生成した画像と別の画像から新たな画像を生成すれば、それは元の著作権とは無関係になるとの見解を示しました。
G :解像度の向上について話し、GPTとビットジャーニーを使用して万博納粋のコンテを作成していることを共有した。 しかし、狙ったアングルを出すのが難しく、特に俯瞰体のサイズ感や周囲のものを正確に捉えるのが難しいと感じている。 また、プロンプトの書き換えによるサイズ感の変化についても触れ、その理由がつかめないと述べた。 最終的にはファイアフライを使用して問題を解決したが、絵のルックはあまり良くないと感じている。
使用した感想
- 細かいところは聞き間違いやうまくまとまりきっていないものもありますが大体のまとめとして、一瞬で作成できたのは大きな前進
- MTGに重要でない会話や雑談などは自然に省かれるので重要な点がわかりやすい
メンバー内で出た意見
- 読み返したくなる要約ではない
- 議事録を生成するだけでなく、次回どういった議題で話せばいいかなど、新しいアイディアを提案してくれるようになればより活用の幅が広がるのではないか
- 要約と文字起こしのサービスを分けて活用することも大事
- 1つのサービスに固執しないことが、時代に乗り遅れないための1つの方法として大事になってくるのではないか
今後使ってみたいサービス
- 動画教材をスクリーンキャプチャと文字起こしから要約するサービスが欲しい。youtubeに上がっている動画で試してみることはできないか検討したい。
- Googleの拡張機能で、記事を動画にしてくれるものがある。
- 動画内容や雑多な文章をボタン1つでブログ化できるもの。
このブログに関しても、AIを活用してリソースを節約し、高頻度で投稿できるようになればいいのではないかと考えていますので、次回また試していけたらなと思っています。