┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ M O D E R N I Z A T I O N S P E C T R U M │ │ │ │ L i f t & S h i f t ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ► C l o u d - N a t i v e │ │ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ E C 2 │ │ M a n a g e d │ │ C o n t a i n e r s │ │ S e r v e r l e s s │ │ │ │ ( V M s ) │ │ S e r v i c e s │ │ ( E C S / E K S ) │ │ ( L a m b d a ) │ │ │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ │ L e s s C h a n g e ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ M o r e C h a n g e │ │ L o w e r B e n e f i t ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ H i g h e r B e n e f i t │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘
┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ S T R A N G L E R F I G P A T T E R N │ │ │ │ P h a s e 1 : F a c a d e i n f r o n t o f m o n o l i t h │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ F a c a d e │ ─ ─ ─ ─ ► │ M o n o l i t h │ │ │ │ ( A L B ) │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ │ P h a s e 2 : E x t r a c t s e r v i c e s g r a d u a l l y │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ F a c a d e │ ─ ─ ─ ─ ► │ M o n o l i t h ( s h r i n k i n g ) │ │ │ │ ( A L B ) │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ │ ─ ─ ─ ─ ► ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ │ │ S e r v i c e A │ ( n e w m i c r o s e r v i c e ) │ │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ │ P h a s e 3 : C o m p l e t e m i g r a t i o n │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ F a c a d e │ ─ ─ ─ ─ ► │ S e r v i c e A │ │ │ │ ( A L B ) │ ─ ─ ─ ─ ► │ S e r v i c e B │ │ │ │ │ ─ ─ ─ ─ ► │ S e r v i c e C │ │ │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘
┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ M I C R O S E R V I C E S A R C H I T E C T U R E │ │ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ A P I G a t e w a y │ │ │ └ ─ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ─ ─ ┘ │ │ │ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┼ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ ▼ ▼ ▼ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ S e r v i c e A │ │ S e r v i c e B │ │ S e r v i c e C │ │ │ │ ( E C S ) │ │ ( L a m b d a ) │ │ ( E K S ) │ │ │ └ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ D y n a m o D B │ │ R D S │ │ S 3 │ │ │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ │ C o m m u n i c a t i o n : │ │ - S y n c : A P I G a t e w a y , A L B │ │ - A s y n c : S Q S , S N S , E v e n t B r i d g e │ │ - S e r v i c e M e s h : A p p M e s h │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘
┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ E V E N T - D R I V E N P A T T E R N S │ │ │ │ P u b l i s h e r ─ ─ ► E v e n t B r i d g e ─ ─ ► S u b s c r i b e r s │ │ │ │ B e n e f i t s : │ │ - L o o s e c o u p l i n g │ │ - S c a l a b i l i t y │ │ - F l e x i b i l i t y │ │ │ │ C o m p o n e n t s : │ │ - E v e n t B r i d g e ( e v e n t b u s ) │ │ - S N S ( p u b / s u b ) │ │ - S Q S ( q u e u e ) │ │ - K i n e s i s ( s t r e a m i n g ) │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘
AWS đẩy mạnh dịch vụ Gen AI từ 2023-2024. SAP-C02 (post-2024) bắt đầu xuất hiện scenario về kiến trúc AI-augmented application — cần nắm các lựa chọn chính.
┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ A M A Z O N B E D R O C K │ │ │ │ F u l l y m a n a g e d s e r v i c e f o r f o u n d a t i o n m o d e l s v i a s i n g l e A P I │ │ │ │ A v a i l a b l e m o d e l s : │ │ - A n t h r o p i c C l a u d e ( S o n n e t , O p u s , H a i k u ) │ │ - A m a z o n T i t a n ( t e x t , e m b e d d i n g s , i m a g e ) │ │ - M e t a L l a m a 3 │ │ - M i s t r a l , A I 2 1 J u r a s s i c , C o h e r e , S t a b i l i t y A I │ │ │ │ K e y f e a t u r e s : │ │ - S e r v e r l e s s ( n o i n f r a t o m a n a g e ) │ │ - P r i v a t e — d a t a k h ô n g d ù n g đ ể t r a i n b a s e m o d e l │ │ - V P C e n d p o i n t s u p p o r t ( P r i v a t e L i n k ) │ │ - I A M - b a s e d a c c e s s , K M S e n c r y p t i o n │ │ │ │ B e d r o c k f e a t u r e s S A P - C 0 2 h a y h ỏ i : │ │ - K n o w l e d g e B a s e s ( R A G : r e t r i e v a l - a u g m e n t e d g e n e r a t i o n ) │ │ - A g e n t s ( t o o l u s e , m u l t i - s t e p r e a s o n i n g ) │ │ - G u a r d r a i l s ( c o n t e n t f i l t e r i n g , P I I r e d a c t i o n ) │ │ - M o d e l e v a l u a t i o n , f i n e - t u n i n g , p r o v i s i o n e d t h r o u g h p u t │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘
Khi nào dùng Bedrock : cần thêm Gen AI vào application mà không muốn quản lý GPU/model serving. Multi-tenant, cross-account access qua IAM Identity Center hoặc resource-based policies.
Tiêu chí Bedrock SageMaker JumpStart Self-managed (EC2/EKS) Quản lý infra Không (serverless) One-click deploy lên endpoint Toàn bộ tự quản Customize model Fine-tuning có giới hạn Full fine-tuning, custom training Toàn quyền Cost model Per token Endpoint + storage EC2/GPU hours Privacy Data không leak ra base model Trong VPC, isolated Full control Operational overhead Thấp nhất Trung bình Cao nhất Use case Production Gen AI app, RAG, agent Custom model, fine-tune sâu Có yêu cầu compliance đặc biệt
┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ R A G A R C H I T E C T U R E T R Ê N A W S │ │ │ │ U s e r q u e r y │ │ │ │ │ ▼ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ A p p ( L a m b d a ) │ │ │ └ ─ ─ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ 1 . E m b e d q u e r y │ │ ▼ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ B e d r o c k T i t a n │ ← E m b e d d i n g s m o d e l │ │ │ E m b e d d i n g s │ │ │ └ ─ ─ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ 2 . V e c t o r s e a r c h │ │ ▼ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ V e c t o r s t o r e │ ← O p e n S e a r c h S e r v e r l e s s , │ │ │ ( k n o w l e d g e b a s e ) │ A u r o r a p g v e c t o r , N e p t u n e , S 3 │ │ └ ─ ─ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ 3 . R e t r i e v e d c o n t e x t + q u e r y │ │ ▼ │ │ ┌ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┐ │ │ │ B e d r o c k C l a u d e / │ ← L L M g e n e r a t e s a n s w e r u s i n g c o n t e x t │ │ │ L l a m a / T i t a n │ │ │ └ ─ ─ ─ ─ ─ ─ ┬ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘ │ │ │ 4 . G e n e r a t e d r e s p o n s e │ │ ▼ │ │ U s e r │ │ │ │ M a n a g e d o p t i o n : B e d r o c k K n o w l e d g e B a s e s t ự đ ộ n g h o á │ │ t o à n b ộ p i p e l i n e e m b e d / s t o r e / r e t r i e v e . │ └ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ┘
SageMaker : end-to-end ML platform (train, deploy, monitor models)
SageMaker JumpStart : pre-trained models + solution templates
Comprehend : NLP (sentiment, entity recognition, language detection)
Textract : OCR + form/table extraction
Rekognition : image/video analysis (faces, objects, moderation)
Transcribe / Polly : speech-to-text / text-to-speech
Translate : real-time translation
Personalize : recommendation engine (NDA tốt với e-commerce)
Q Developer (formerly CodeWhisperer) : AI code assistant cho IDE/CLI
Yêu cầu trong câu hỏi Service phù hợp "Use foundation models với least operational overhead" Bedrock "Customize model với enterprise data, không leak data" Bedrock fine-tuning hoặc Knowledge Bases "Build chatbot với context từ internal docs" Bedrock + Knowledge Bases (RAG) "Multi-step agent với tool use" Bedrock Agents "Content moderation, PII redaction" Bedrock Guardrails hoặc Comprehend PII "Train custom model từ đầu, full control" SageMaker (training jobs) "Quick deploy pre-trained model" SageMaker JumpStart
Ngày tiếp theo : Quiz tổng kết Tuần 9-10