AWSのAI関連の情報をアップデート
2025.04.28
AWS東京リージョンでのBedrockは利用料金が高かったのですが、ここ1年くらいでかなり抑えることができるようになりました。
■状況の変化
・2024年5月、RAGとして「ナレッジベース」が東京リージョンでサポートされた。
Kendra以外の選択肢が出来て、Kendraより安い。
「GenAI Enterprise Edition」が東京で使えるようになれば、要比較。
・2023年12月、言語モデルの「Claude Instant」が東京リージョンでサポートされた。
料金は Claude 2.1 の 1/10くらい
・2024年3月、言語モデルの「Claude 3 Haiku」が東京リージョンでサポートされた。
「Claude Instant」の 1/3くらい
この辺りはOpenAIと競争してどんどん安くなっていくと思われる。
・2023年12月、ベクトルストアの格納先として「Amazon Aurora PostgreSQL Serverless」が東京リージョンでサポートされた。
OpenSearch Serverless の半額くらい
■結果
・従量課金なので、月額xxx円とはいえませんが、東京リージョンでもかなり安く実装できるようなった。
チャットボット等、現実的な値段で運用できるので提案しやすくなった。
・言語モデルは安くなっても生成された回答の精度はとても高い。この辺りは事前にナレッジベースに質のよい情報を食べさせてあげることが重要。
・各言語のSDKの「retrieveAndGenerate」メソッドを使えば、ナレッジベースを検索し、回答の生成まで一発でやってくれるのでとても便利。
最新記事
- AWSのAI関連の情報をアップデート
- 自社サービス「クイズファミリー」の開発
- ランニングフォームの数値化
- AIに小説を書いてもらう
- AWS Managed Blockchain(AMB)の使用・・・
- APIサービスをどう作るか
- C++による組込みプログラミング
- CUDAでGPUプログラミング
- BERTでチャットボット
- 脆弱性チェックツール
- Flutterでデスクトップアプリ
- MMPoseを使って姿勢推定(骨格検知)
- Laravel Livewire3を使ってみる
- Lineミニアプリ
- RustとPHPのパフォーマンス比較
- ボクシングをモーションキャプチャー
- Virtualbox上のUbuntuにDocker環境を作れ・・・
- AWSでのIPv6対応
- AWSのRDSでブルー/グリーンデプロイ
- 20年ぶりにCOBOL