AWSのAI関連の情報をアップデート

2025.04.28

AWS東京リージョンでのBedrockは利用料金が高かったのですが、ここ1年くらいでかなり抑えることができるようになりました。

■状況の変化
・2024年5月、RAGとして「ナレッジベース」が東京リージョンでサポートされた。
Kendra以外の選択肢が出来て、Kendraより安い。
「GenAI Enterprise Edition」が東京で使えるようになれば、要比較。

・2023年12月、言語モデルの「Claude Instant」が東京リージョンでサポートされた。
料金は Claude 2.1 の 1/10くらい

・2024年3月、言語モデルの「Claude 3 Haiku」が東京リージョンでサポートされた。
「Claude Instant」の 1/3くらい

この辺りはOpenAIと競争してどんどん安くなっていくと思われる。

・2023年12月、ベクトルストアの格納先として「Amazon Aurora PostgreSQL Serverless」が東京リージョンでサポートされた。
OpenSearch Serverless の半額くらい

■結果
・従量課金なので、月額xxx円とはいえませんが、東京リージョンでもかなり安く実装できるようなった。
チャットボット等、現実的な値段で運用できるので提案しやすくなった。

・言語モデルは安くなっても生成された回答の精度はとても高い。この辺りは事前にナレッジベースに質のよい情報を食べさせてあげることが重要。

・各言語のSDKの「retrieveAndGenerate」メソッドを使えば、ナレッジベースを検索し、回答の生成まで一発でやってくれるのでとても便利。

最新記事

過去の記事一覧