E-commerce Product Description System Architecture Guide

From prompts to production content pipeline.

Monday: 3 prompts for product descriptions. Tuesday: automated generation code. Wednesday: team workflows for content ops. Thursday: complete technical architecture. Agents, ML pipeline, SEO optimization, and CMS integration for 100K+ products daily.

Key Assumptions

•Catalog size: 1K-500K SKUs, growing 5-10% monthly
•Update frequency: New products daily, refreshes quarterly
•SEO requirements: Target keywords, readability scores, meta tags
•Brand consistency: Voice guidelines, prohibited terms, templates
•Integration: Shopify/Magento/BigCommerce or custom CMS API

System Requirements

Functional

Generate product descriptions from attributes (title, specs, images)
SEO optimization: keyword density, meta descriptions, alt text
Brand voice enforcement: tone, style, prohibited words
Bulk processing: 1K+ products in single batch
CMS integration: Push to Shopify, Magento, or custom API
A/B testing: Multiple variants per product
Quality scoring: Readability, uniqueness, keyword coverage

Non-Functional (SLOs)

latency p95 ms3000

freshness min60

availability percent99.5

quality score min85

💰 Cost Targets: {"per_product_usd":0.02,"per_batch_1k_usd":15,"monthly_infra_usd":500}

Agent Layer

planner

Decompose product description task into steps: template selection, content generation, SEO optimization, quality check

🔧 template_selector, keyword_research_api, brand_policy_checker

⚡ Recovery: If no template found → fallback to generic template, If keyword API fails → use cached keywords from last 24h

executor

Execute the plan: generate description, apply template, call LLM, format output

🔧 openai_api, template_engine, image_analyzer

⚡ Recovery: If LLM timeout → retry 3x with exponential backoff, If generation fails → queue for human review

seo_agent

Optimize description for search: keyword density, readability, meta tags, structured data

🔧 semrush_api, readability_scorer, keyword_density_analyzer

⚡ Recovery: If SEMrush API down → use cached keyword data, If density too low → regenerate with keyword boost

evaluator

Validate output quality: brand voice, readability, uniqueness, keyword coverage

🔧 plagiarism_checker, brand_voice_classifier, readability_api

⚡ Recovery: If score < 80 → trigger regeneration with feedback, If plagiarism detected → block and flag

guardrail

Policy enforcement: prohibited terms, legal compliance, safety filters

🔧 prohibited_terms_checker, legal_compliance_api, toxicity_detector

⚡ Recovery: If violation found → block publish, queue for review, If legal API down → default to conservative blocking

template_agent

Select and populate category-specific templates with product data

🔧 template_db, variable_extractor, style_matcher

⚡ Recovery: If no category template → use generic, If missing variables → mark as optional

ML Layer

Feature Store

Update: Daily batch + real-time on product update

• product_attribute_embeddings
• historical_conversion_rate
• category_avg_quality_score
• brand_voice_vector
• competitor_keyword_density
• seasonal_keyword_trends

Model Registry

Strategy: Blue-green deployment with 10% canary

• gpt-4o-mini
• brand_voice_classifier
• readability_scorer
• keyword_ranker

Observability

Metrics

📊 generation_success_rate
📊 llm_latency_p95_ms
📊 quality_score_avg
📊 approval_rate_percent
📊 regeneration_rate_percent
📊 cost_per_product_usd
📊 seo_score_avg
📊 keyword_density_avg

Dashboards

📈 ops_dashboard
📈 ml_dashboard
📈 cost_dashboard
📈 quality_dashboard

Traces

✅ Enabled

Deployment Variants

🚀 Startup

Infrastructure:

• Vercel/Netlify for frontend
• Serverless functions (Lambda/Cloud Run)
• Managed PostgreSQL (Supabase/Neon)
• Redis Cloud
• OpenAI API (pay-as-you-go)
• Shopify integration (OAuth app)

→ Quick to ship, low upfront cost

→ Auto-scaling with serverless

→ Managed services reduce ops burden

→ Cost: ~$100-500/mo depending on volume

🏢 Enterprise

Infrastructure:

• Kubernetes (EKS/GKE) for control plane
• VPC isolation + private subnets
• Aurora PostgreSQL (multi-AZ)
• Redis Cluster (ElastiCache)
• BYO LLM (self-hosted or Azure OpenAI)
• KMS/HSM for encryption
• SSO/SAML integration
• Multi-region deployment
• Dedicated support + SLA

→ Full control over infrastructure

→ Data residency compliance (GDPR, SOC2)

→ Private networking, no public internet

→ Cost: $5K-20K/mo depending on scale

📈 Migration: Start with startup stack. Migrate to enterprise when: (1) >10K products/day, (2) Need data residency, (3) Require 99.9% SLA, (4) Custom LLM or private deployment. Migration path: Lift-and-shift to containers → VPC setup → Multi-region replication → BYO LLM.

Risks & Mitigations

⚠️ LLM generates off-brand content

Medium

✓ Mitigation: Multi-layer validation: brand voice classifier (94% accuracy), human review queue for low-confidence outputs, regular fine-tuning on approved content

⚠️ Hallucinated product features

Medium

✓ Mitigation: Attribute validation against product DB, fact-checking layer, confidence scoring, 100% human review for high-value products (>$500)

⚠️ SEO keyword stuffing (Google penalty)

Low

✓ Mitigation: Keyword density limits (2-3%), readability scoring (Flesch-Kincaid >60), A/B test against human-written baseline

⚠️ API rate limits (OpenAI, Shopify)

High

✓ Mitigation: Multi-LLM failover, exponential backoff, queue-based retry, rate limiter (10 req/sec), caching for 24h

⚠️ Cost overruns (LLM API costs)

Medium

✓ Mitigation: Cost tracking per product, alerts at $1K/day, auto-throttle at $5K/day, monthly budget caps, cheaper models for low-priority products

⚠️ Data privacy violation (PII in descriptions)

Low

✓ Mitigation: PII detection + redaction, no customer data in prompts, audit logs (2yr retention), privacy-by-design

⚠️ Competitor trademark infringement

Medium

✓ Mitigation: Trademark database check, prohibited terms blocklist (500+ brands), legal review for high-risk categories, guardrail agent enforcement

Evolution Roadmap

Phase 1: MVP (0-3 months)

Q1 2025

→ Launch with 3 core agents (Executor, Evaluator, Guardrail)
→ Shopify integration only
→ 100-500 products/day capacity
→ 90% quality score target

Phase 2: Scale (3-6 months)

Q2 2025

→ Add Planner, SEO, Template agents
→ Multi-platform support (Magento, BigCommerce)
→ 1K-10K products/day capacity
→ A/B testing framework
→ 95% approval rate

Phase 3: Enterprise (6-12 months)

Q3-Q4 2025

→ 10K-100K products/day capacity
→ Multi-region deployment
→ 99.9% SLA
→ Custom LLM support
→ Enterprise security (SSO, RBAC, audit)

Complete Systems Architecture

End-to-end layer view

Presentation

Admin Dashboard

Bulk Upload UI

Preview Portal

API Gateway

Load Balancer

Rate Limiter

Auth (API Keys)

Agent Layer

Planner Agent

Executor Agent

Evaluator Agent

Guardrail Agent

SEO Agent

Template Agent

ML Layer

Feature Store

Model Registry

Prompt Store

Evaluation Engine

Integration

Shopify Adapter

SEMrush Connector

Image Analyzer

Data

PostgreSQL (products)

Redis (cache)

S3 (assets)

External

OpenAI API

Shopify API

SEMrush API

Observability

Metrics (Prometheus)

Logs (CloudWatch)

Traces (Jaeger)

Security

API Auth

Secrets Manager

Audit Logs

Sequence Diagram - Product Description Flow

E-commerce Product Description - Agent Orchestration

7 Components

HTTP

REST

gRPC

Event

Stream

WebSocket

E-commerce Product Description - External Integrations

9 Components

HTTP

REST

gRPC

Event

Stream

WebSocket

Data Flow - Product to Published Description

End-to-end flow in 4.5 seconds

User0ms

Submits product data → SKU, title, attributes, images

API Gateway50ms

Validates request, rate limits → Authenticated request

Planner Agent500ms

Plans task, selects template, fetches keywords → Execution plan + target keywords

Template Agent200ms

Populates category template → Structured template with variables

Executor Agent2000ms

Generates description via LLM → Draft description (300-500 words)

SEO Agent800ms

Optimizes keywords, creates meta tags → Optimized description + meta tags

Evaluator Agent600ms

Validates quality, brand voice → Quality score: 92, approved

Guardrail Agent300ms

Checks prohibited terms, legal compliance → No violations, approved

Shopify Adapter500ms

Formats for Shopify API, publishes → Product updated in CMS

Audit Logger50ms

Logs transaction → Audit trail created

Scaling Patterns

Volume

0-100 products/day

Pattern

Synchronous API

Architecture

• Single API server

• Direct LLM calls

• PostgreSQL

• Redis cache

Cost

$100/mo

4-5s

Volume

100-1K products/day

Pattern

Queue + Workers

Architecture

• API server

• Redis queue

• 3-5 worker processes

• PostgreSQL

• S3 for assets

Cost

$400/mo

3-4s

Volume

1K-10K products/day

Pattern

Multi-Agent Orchestration

Architecture

• Load balancer

• LangGraph orchestrator

• SQS message bus

• Lambda functions

• RDS + ElastiCache

• S3 + CloudFront

Cost

$1500/mo

2-3s

Volume

10K-100K products/day

Pattern

Enterprise Multi-Region

Architecture

• Global load balancer

• Kubernetes cluster

• Kafka event streaming

• Multi-LLM fallback

• Aurora PostgreSQL (multi-region)

• Redis Cluster

• CDN for assets

Cost

$5000+/mo

1-2s

Key Integrations

Shopify API

Protocol: REST + GraphQL

Fetch product data via GET /products/{id}

Generate description

Update via PUT /products/{id} with description + meta

Webhook notification on success

SEMrush API

Protocol: REST

Query keyword difficulty + search volume

Get competitor keyword analysis

Return top 10 target keywords

Cache results for 24h

OpenAI API

Protocol: REST

Send prompt + product data

Stream response (SSE)

Parse JSON output

Handle rate limits (exponential backoff)

Image Analysis (AWS Rekognition)

Protocol: AWS SDK

Upload product image to S3

Call DetectLabels API

Extract features (color, style, objects)

Use in description generation

Security & Compliance

Failure Modes & Fallbacks

Failure	Fallback	Impact	SLA
OpenAI API down	Switch to backup LLM (Anthropic Claude) or queue for retry	Degraded performance, 10% slower	99.5%
SEMrush API timeout	Use cached keywords from last 24h or generic keywords	Slightly lower SEO optimization	99.0%
Quality score < 80	Regenerate with feedback or queue for human review	Delayed publication, maintains quality	95% auto-approval
Guardrail detects policy violation	Block publication, flag for review	Safety maintained, no bad content published	100% enforcement
Shopify API rate limit	Exponential backoff, queue remaining products	Delayed sync, eventual consistency	99.0%
Database connection loss	Read from replica, queue writes	Read-only mode for up to 5 minutes	99.9%
Template not found for category	Use generic fallback template	Less customized output	100% coverage

Multi-Agent Architecture

6 specialized agents collaborate autonomously

┌──────────────┐
│   Planner    │ ← Orchestrates all agents
└──────┬───────┘
       │
   ┌───┴────┬──────────┬──────────┬──────────┐
   │        │          │          │          │
┌──▼──┐  ┌─▼──┐  ┌────▼────┐  ┌──▼───┐  ┌──▼────┐
│Temp │  │Exec│  │   SEO   │  │Eval  │  │Guard  │
│Agent│  │utor│  │  Agent  │  │uator │  │rail   │
└─────┘  └────┘  └─────────┘  └──────┘  └───────┘
    │       │          │          │          │
    └───────┴──────────┴──────────┴──────────┘
                       │
                   ┌───▼────┐
                   │Shopify │
                   │Adapter │
                   └────────┘

Agent Collaboration Flow

Planner

Receives product data, plans execution: template selection → generation → SEO → quality check

Template Agent

Selects category-specific template, populates with product attributes

Executor

Generates description via LLM using populated template → Returns draft

SEO Agent

Optimizes keywords, creates meta tags, structured data → Returns optimized version

Evaluator

Validates quality (brand voice, readability, uniqueness) → Returns score + approval

Guardrail

Checks prohibited terms, legal compliance → Blocks if violation, else approves

Planner

Decision: Approved? → Publish to CMS : Regenerate with feedback or queue for human review

Reactive Agent

Template Agent - Selects template based on category

Autonomy: LowStateless

Reflexive Agent

Executor Agent - Generates based on template + context

Autonomy: MediumReads context

Deliberative Agent

SEO Agent - Plans keyword strategy, optimizes iteratively

Autonomy: HighStateful

Orchestrator Agent

Planner - Coordinates all agents, makes routing decisions

Autonomy: HighestFull state management

Levels of Autonomy

Tool

Human calls, agent responds

→ Monday's prompts

Chained Tools

Sequential execution

→ Tuesday's code

Agent

Makes decisions, can loop

→ SEO Agent iterates on keywords

Multi-Agent

Agents collaborate autonomously

→ This system

Advanced ML/AI Patterns

Production ML engineering beyond basic API calls

RAG vs Fine-Tuning

Product catalogs change daily. RAG allows real-time updates without retraining. Fine-tuning would require weekly retraining ($$$).

✅ RAG (Chosen)

Cost: $200/mo (vector DB)

Update: Real-time

How: Embed product attributes, retrieve similar descriptions

❌ Fine-Tuning

Cost: $2K/mo (training + hosting)

Update: Weekly batch

How: Train on 10K+ product descriptions

Implementation: Pinecone vector DB with product embeddings. Retrieve top 5 similar products during generation for style consistency.

Hallucination Detection

LLMs hallucinate product features (fake specs, wrong materials)

Confidence scoring (flag if < 0.8)

Attribute validation against product DB

Fact-checking via secondary LLM call

Human review for low-confidence outputs

Hallucination rate: 0.5%, 100% caught before publication

Evaluation Framework

Quality Score

89.3target: 85+

Brand Voice Match

93.1%target: 90%+

SEO Score

84.7target: 80+

Human Approval Rate

96.8%target: 95%+

Conversion Lift (A/B test)

+7.2%target: +5%

Testing: Shadow mode: 500 products parallel with human-written descriptions, A/B test for 2 weeks

Dataset Curation

Collect: 50K product descriptions - Scrape from top e-commerce sites

Clean: 42K usable - Remove duplicates, filter low quality

Label: 42K labeled - ($$21K)

Augment: +8K synthetic - Generate edge cases (missing specs, unusual products)

→ 50K high-quality training examples (Inter-annotator agreement: 0.89)

Agentic RAG

Agent iteratively retrieves based on reasoning

Product has 'organic cotton' → RAG retrieves sustainability claims → Agent reasons 'need certifications' → RAG retrieves GOTS/OEKO-TEX data → Description includes verified sustainability info

💡 Not one-shot retrieval. Agent decides what context is needed for accurate, compliant descriptions.

Multi-Variant Generation

Tech Stack Summary

LLMs

GPT-4o-mini (primary), Claude 3.5 Sonnet (fallback)

Orchestration

LangGraph (agent framework)

Database

PostgreSQL (products, descriptions), Redis (cache, queue)

Vector DB

Pinecone or Weaviate

Queue

Redis Queue (startup), SQS (scale), Kafka (enterprise)

Compute

Lambda/Cloud Run (serverless), ECS/K8s (enterprise)

CMS Integration

Shopify SDK, Magento REST API, custom adapters

SEO Tools

SEMrush API, Ahrefs API (optional)

Monitoring

Prometheus + Grafana, CloudWatch, Datadog

Security

AWS Secrets Manager, KMS, WAF

🏗️

Need Architecture Review?

We'll audit your content generation system, identify bottlenecks, and show you how to scale to 100K products/day.

Product Description System Architecture 🏗️

From prompts to production content pipeline.

Key Assumptions

System Requirements

Functional

Non-Functional (SLOs)

Agent Layer

planner

executor

seo_agent

evaluator

guardrail

template_agent

ML Layer

Feature Store

Model Registry

Observability

Metrics

Dashboards

Traces

Deployment Variants

🚀 Startup

🏢 Enterprise

Risks & Mitigations

⚠️ LLM generates off-brand content

⚠️ Hallucinated product features

⚠️ SEO keyword stuffing (Google penalty)

⚠️ API rate limits (OpenAI, Shopify)

⚠️ Cost overruns (LLM API costs)

⚠️ Data privacy violation (PII in descriptions)

⚠️ Competitor trademark infringement

Evolution Roadmap

Phase 1: MVP (0-3 months)

Phase 2: Scale (3-6 months)

Phase 3: Enterprise (6-12 months)

Complete Systems Architecture

Sequence Diagram - Product Description Flow

E-commerce Product Description - Agent Orchestration

E-commerce Product Description - External Integrations

Data Flow - Product to Published Description

Scaling Patterns

Key Integrations

Shopify API

SEMrush API

OpenAI API

Image Analysis (AWS Rekognition)

Security & Compliance

Failure Modes & Fallbacks

Multi-Agent Architecture

Agent Collaboration Flow

Reactive Agent

Reflexive Agent

Deliberative Agent

Orchestrator Agent

Levels of Autonomy

Advanced ML/AI Patterns

RAG vs Fine-Tuning

Hallucination Detection

Evaluation Framework

Dataset Curation

Agentic RAG

Multi-Variant Generation

Tech Stack Summary

Need Architecture Review?