Architektura multi-agent w AI — jak Smart-Copy.ai generuje ebooki do 150 stron

Dlaczego ChatGPT nie napisze spójnego tekstu na 50 stron? Wyjaśniamy architekturę multi-agent Smart-Copy.ai: Kierownik planuje strukturę, zespół do 7 Pisarzy realizuje sekcje sekwencyjnie z przekazywaniem kontekstu. System samonaprawy, dynamiczne skalowanie i porównanie z konkurencją.

Dlaczego ChatGPT nie napisze spójnego tekstu na 50 stron?

Każdy, kto próbował wygenerować dłuższy tekst w ChatGPT, zna ten problem: po kilku tysiącach słów model zaczyna się gubić. Powtarza wcześniejsze fragmenty, zapomina o czym pisał na początku, traci główny wątek narracji. Poprosisz o kontynuację — a kolejna część brzmi, jakby pisała ją zupełnie inna osoba. To nie wina ChatGPT ani żadnego innego modelu AI — to fundamentalne ograniczenie architektury dużych modeli językowych (LLM), które mają skończone „okno kontekstowe" i nie są w stanie utrzymać spójności w bardzo długich tekstach.

Smart-Copy.ai rozwiązuje ten problem w sposób, który na pierwszy rzut oka wydaje się prosty, ale w praktyce wymagał miesięcy R&D: zamiast jednego modelu AI piszącego cały tekst, używamy zespołu wyspecjalizowanych agentów, którzy współpracują jak redakcja magazynu. Kierownik (Manager) planuje strukturę i nadzoruje całość, a Pisarze (Writers) realizują poszczególne sekcje według jego wytycznych. W tym artykule pokażemy dokładnie, jak działa ta architektura — krok po kroku, z technicznymi szczegółami i przykładami.

Problem okna kontekstowego — dlaczego jeden model nie wystarczy

Zanim wyjaśnimy rozwiązanie, warto zrozumieć problem. Modele językowe jak Claude czy GPT mają ograniczenie zwane „oknem kontekstowym" — maksymalną ilością tekstu, którą mogą „widzieć" jednocześnie. Dla Claude Sonnet 4.5 to około 200 000 tokenów (mniej więcej 150 000 słów), co brzmi imponująco. Problem polega na tym, że to okno musi pomieścić zarówno prompt systemowy, źródła, instrukcje, JAK I generowany tekst. W praktyce na sam output zostaje znacznie mniej miejsca.

Ale nawet gdyby okno kontekstowe było nieskończone, pozostaje drugi problem: jakość generowania spada przy bardzo długich tekstach. Model „zapomina" o wcześniejszych ustaleniach, powtarza się, traci spójność stylistyczną. To nie bug — to cecha architektury transformer, na której opierają się wszystkie współczesne LLM. Pojedynczy model po prostu nie jest zaprojektowany do pisania 50-stronicowych dokumentów w jednym ciągu. Potrzebne jest inne podejście.

Limity w praktyce

Przy generowaniu artykułu 10-stronicowego (około 20 000 znaków) w jednym wywołaniu API, model otrzymuje: prompt systemowy (~5 000 tokenów), źródła z researchu (~30 000-50 000 tokenów), instrukcje dotyczące struktury i SEO (~2 000 tokenów). Na sam tekst wyjściowy zostaje około 10 000-15 000 tokenów — czyli maksymalnie te 20 000 znaków. Ale co jeśli potrzebujesz 50, 100 czy 150 stron? Jeden model fizycznie nie jest w stanie tego wygenerować.

Architektura multi-agent — zespół zamiast jednostki

Rozwiązaniem jest architektura multi-agent, inspirowana tym, jak działają prawdziwe redakcje i zespoły content marketingowe. W Smart-Copy.ai zaimplementowaliśmy system dwupoziomowy: Kierownik (Manager) odpowiada za planowanie i koordynację, a zespół do 7 Pisarzy (Writers) realizuje faktyczne pisanie. Każdy agent to osobne wywołanie modelu AI z dedykowanym promptem i zadaniem. Agenci komunikują się między sobą przez ustrukturyzowane dane — Kierownik przekazuje Pisarzom plan, Pisarze zwracają gotowe sekcje.

Ta architektura rozwiązuje oba problemy jednocześnie. Po pierwsze, każdy Pisarz generuje tylko fragment tekstu (typowo 3 000-8 000 znaków), więc mieści się komfortowo w oknie kontekstowym z pełnym dostępem do źródeł i instrukcji. Po drugie, Kierownik utrzymuje spójność całości — zna pełną strukturę, monitoruje co już zostało napisane i daje Pisarzom precyzyjne wytyczne, co mają napisać dalej. Efekt: tekst 50-stronicowy jest równie spójny jak 5-stronicowy.

Kierownik (Manager) — mózg operacji

Kierownik to pierwszy agent, który uruchamia się po zakończeniu fazy researchu. Jego zadanie to stworzenie kompletnego planu artykułu na podstawie: tematu i wytycznych od użytkownika, wybranych źródeł z researchu, wymaganej długości tekstu, parametrów SEO (fraza kluczowa, linki wewnętrzne). Kierownik nie pisze żadnej treści — jego output to ustrukturyzowany plan w formacie JSON.

Plan Kierownika zawiera: listę wszystkich sekcji (nagłówki H2 i H3), szacowaną długość każdej sekcji w znakach, kluczowe punkty do omówienia w każdej sekcji, rozmieszczenie elementów formatowania (gdzie mają być tabele, listy, przykłady), przypisanie fraz kluczowych i linków SEO do konkretnych sekcji. Kierownik oblicza też, ilu Pisarzy będzie potrzebnych — dla tekstu do 20 000 znaków wystarczy jeden, dla dłuższych tekstów system przydziela kolejnych Pisarzy (do maksymalnie 7).

Przykład planu Kierownika

Dla artykułu o temacie „Content marketing dla e-commerce — kompletny przewodnik" z wymaganą długością 25 000 znaków, Kierownik może wygenerować następujący plan:

Sekcja	Nagłówek	Długość	Pisarz	Elementy
1	H2: Dlaczego e-commerce potrzebuje content marketingu?	~3 500 zn	Writer 1	Statystyki, fraza kluczowa w H2
2	H2: Rodzaje treści dla sklepów internetowych	~4 000 zn	Writer 1	Lista wypunktowana, przykłady
3	H2: Blog sklepu — jak pisać, żeby sprzedawać?	~5 000 zn	Writer 2	H3 podsekcje, link SEO #1
4	H2: Opisy produktów, które konwertują	~4 500 zn	Writer 2	Tabela porównawcza, przykłady
5	H2: SEO dla e-commerce — podstawy	~4 000 zn	Writer 3	Link SEO #2, lista checklisty
6	H2: Mierzenie efektów content marketingu	~3 000 zn	Writer 3	Tabela KPI, podsumowanie

Pisarze (Writers) — specjaliści od treści

Po zatwierdzeniu planu przez Kierownika, system uruchamia Pisarzy sekwencyjnie — jeden po drugim. Każdy Pisarz otrzymuje dedykowany prompt zawierający: pełny plan artykułu od Kierownika (żeby znał kontekst całości), źródła z researchu, konkretne sekcje do napisania (np. „napisz sekcje 3 i 4"), ostatnie 5 000 znaków tekstu napisanego przez poprzedniego Pisarza (dla płynności przejść), listę już napisanych nagłówków (zapobieganie powtórzeniom).

Pisarz generuje tylko przypisane mu sekcje — nie próbuje napisać całego artykułu. To kluczowe dla jakości: zamiast 25 000 znaków w jednym wywołaniu (co przekraczałoby komfortowy limit i obniżało jakość), każdy Pisarz generuje 6 000-10 000 znaków z pełnym dostępem do źródeł i jasnym kontekstem. Jakość każdej sekcji jest więc równie wysoka jak w krótkim artykule.

Mechanizm przekazywania kontekstu

Najważniejszym elementem architektury jest sposób, w jaki Pisarze „wiedzą", co napisali ich poprzednicy. Każdy kolejny Pisarz otrzymuje:

Ostatnie 5 000 znaków poprzedniej sekcji — pozwala to na płynne przejście stylistyczne i narracyjne. Pisarz „widzi", jak kończy się poprzednia część i może naturalnie kontynuować.
Listę wszystkich napisanych nagłówków H2 i H3 — zapobiega to powtarzaniu tematów. Jeśli Writer 1 napisał o „rodzajach treści", Writer 2 nie będzie tego powielał.
Streszczenie kluczowych ustaleń — jeśli w sekcji 2 padły konkretne liczby lub definicje, kolejni Pisarze mogą się do nich odwoływać spójnie.
Informację o pozycji w tekście — Pisarz wie, czy pisze środek artykułu (może odwoływać się do wcześniejszych i zapowiadać późniejsze sekcje) czy zakończenie (powinien podsumowywać).

System samonaprawy — co gdy coś pójdzie nie tak?

W systemie z wieloma agentami rzeczy mogą pójść nie tak: model może wygenerować tekst krótszy niż oczekiwano, urwać w połowie zdania (limit tokenów), pominąć wymagany element (np. link SEO) lub wygenerować zduplikowany nagłówek. Smart-Copy.ai ma wbudowane mechanizmy samonaprawy, które automatycznie wykrywają i korygują te problemy.

Każdy output Pisarza przechodzi przez walidator, który sprawdza: czy tekst ma wymaganą długość (±15% tolerancji), czy ostatnie zdanie jest kompletne gramatycznie, czy wszystkie wymagane elementy SEO zostały umieszczone, czy nie ma duplikacji nagłówków. Jeśli walidacja wykryje problem, system automatycznie uruchamia korektę — na przykład dodatkowe wywołanie AI z instrukcją „dokończ ostatnie zdanie i dodaj podsumowanie" lub „wstaw brakujący link SEO w naturalny sposób".

Mechanizm kontynuacji przy urwanym tekście

Najczęstszy problem to urwanie tekstu przez limit tokenów — model po prostu przestaje generować w losowym miejscu. System wykrywa to automatycznie (ostatni znak nie jest kropką, wykrzyknikiem ani znakiem zapytania kończącym zdanie) i uruchamia kontynuację. Pisarz otrzymuje prompt: „Kontynuuj dokładnie od miejsca, w którym skończyłeś: [ostatnie 500 znaków]. Dokończ bieżącą myśl i sekcję." System może wykonać do 5 takich kontynuacji, zanim uzna sekcję za kompletną.

Dynamiczne skalowanie — od 1 do 7 Pisarzy

Liczba Pisarzy nie jest stała — system dynamicznie dobiera ją do wymaganej długości tekstu. Algorytm jest prosty: każdy Pisarz może komfortowo wygenerować 5 000-10 000 znaków wysokiej jakości. Dla tekstu 20 000 znaków wystarczy więc 2-3 Pisarzy, dla 50 000 znaków potrzeba 5-6, a dla maksymalnych 300 000 znaków (około 150 stron A4) system uruchamia pełny zespół 7 Pisarzy w wielu rundach.

Kierownik oblicza optymalną liczbę Pisarzy na etapie planowania i rozdziela sekcje równomiernie. Dzięki temu żaden Pisarz nie jest przeciążony (co obniżyłoby jakość), a cały tekst generuje się w optymalnym czasie. Dla artykułu 10-stronicowego (1 Pisarz) to 2-4 minuty, dla 50-stronicowego (4-5 Pisarzy) — 8-15 minut, dla 150-stronicowego (7 Pisarzy, wiele rund) — 30-60 minut.

Długość tekstu	Liczba Pisarzy	Czas generowania	Przykładowe zastosowanie
Do 15 000 znaków	1	2-4 min	Artykuł blogowy, opis produktu
15 000 - 40 000 znaków	2-3	4-8 min	Obszerny poradnik, raport
40 000 - 80 000 znaków	4-5	8-15 min	Ebook, whitepaper
80 000 - 150 000 znaków	5-6	15-30 min	Obszerny ebook, dokumentacja
150 000 - 300 000 znaków	7 (wiele rund)	30-60 min	Książka, kompendium

Spójność stylistyczna — jak ją zachować?

Sceptyk mógłby zapytać: skoro tekst piszą różni Pisarze (różne wywołania AI), czy nie będzie niespójny stylistycznie? To uzasadniona obawa — i właśnie dlatego Kierownik pełni tak ważną rolę. Oprócz planowania struktury, Kierownik definiuje „style guide" dla całego artykułu: ton (formalny, konwersacyjny, ekspercki), poziom trudności (dla laików, specjalistów, ekspertów), formatowanie (jak często używać list, tabel, przykładów), głos narracyjny (pierwsza osoba, trzecia osoba, bezosobowy).

Każdy Pisarz otrzymuje ten sam style guide w swoim prompcie, plus przykład tonu z poprzednich sekcji (ostatnie 5 000 znaków). W praktyce spójność stylistyczna jest bardzo wysoka — często wyższa niż w tekstach pisanych przez jedną osobę przez kilka dni, bo model AI nie ma „gorszych dni" i nie zapomina ustalonego tonu między sesjami. W testach A/B czytelnicy nie byli w stanie rozpoznać, gdzie kończy się praca jednego Pisarza i zaczyna drugiego.

Porównanie z konkurencją — dlaczego to działa lepiej?

Większość generatorów AI na rynku używa prostszych podejść: albo generują tekst w jednym wywołaniu (z ograniczeniami długości i jakości), albo oferują „kontynuację" — użytkownik musi ręcznie prosić o dalszą część tekstu, a model generuje ją bez pełnego kontekstu poprzednich sekcji. Smart-Copy.ai to jedyny znany nam generator, który implementuje pełną architekturę multi-agent z Kierownikiem i zespołem Pisarzy.

Aspekt	ChatGPT / Claude	Jasper / Copy.ai	Smart-Copy.ai
Maksymalna długość	~4 000 słów / odpowiedź	~5 000 słów / dokument	~150 stron (300 000 znaków)
Spójność długich tekstów	Spada przy kontynuacjach	Średnia	Wysoka (Kierownik + kontekst)
Automatyczne planowanie	Brak	Podstawowe szablony	Pełny plan od Kierownika
Przekazywanie kontekstu	Manualne (kopiuj-wklej)	Ograniczone	Automatyczne 5000 zn + nagłówki
Samonaprawa błędów	Brak	Brak	Walidacja + auto-kontynuacja
Nakład pracy użytkownika	Wysoki (prompty, sklejanie)	Średni	Minimalny (formularz)

Techniczne szczegóły implementacji

Dla zainteresowanych technicznymi detalami: Smart-Copy.ai jest zbudowany na modelu Claude Sonnet 4.5 od Anthropic. Każdy agent (Kierownik i Pisarze) to osobne wywołanie API z dedykowanym promptem systemowym. Komunikacja między agentami odbywa się przez ustrukturyzowane dane JSON — Kierownik zwraca plan w formacie JSON Schema, który jest walidowany przed przekazaniem Pisarzom. Cały pipeline jest zaimplementowany w TypeScript na Fastify, z PostgreSQL jako bazą danych i kolejkowaniem przez system zamówień.

Sekwencyjne wykonywanie Pisarzy (nie równoległe) jest celowe — każdy kolejny Pisarz potrzebuje outputu poprzedniego dla kontekstu. To wydłuża czas generowania w porównaniu z podejściem równoległym, ale dramatycznie poprawia spójność. Testowaliśmy wariant równoległy i jakość była zauważalnie niższa — Pisarze „nadeptywali sobie na pięty", powtarzając podobne treści bez wiedzy o tym, co piszą inni.

Podsumowanie — orkiestra zamiast solisty

Architektura multi-agent w Smart-Copy.ai to odpowiedź na fundamentalne ograniczenia pojedynczych modeli AI. Zamiast zmuszać jeden model do napisania 50-stronicowego dokumentu (czego nie jest w stanie zrobić dobrze), orkiestrujemy zespół wyspecjalizowanych agentów: Kierownik planuje, Pisarze piszą, walidatory sprawdzają, system samonaprawy koryguje błędy. Efekt to teksty o długości do 150 stron A4, ze spójnością stylistyczną i merytoryczną porównywalną z pracą profesjonalnego zespołu redakcyjnego.

To nie jest marketingowe hasło — to rzeczywista przewaga technologiczna, której nie oferuje żaden inny generator na rynku. ChatGPT urwie się po 4 000 słów. Jasper wymaga ręcznego sklejania sekcji. Smart-Copy.ai wygeneruje kompletny ebook bez żadnej interwencji użytkownika — od jednego kliknięcia do gotowego dokumentu.

Chcesz zobaczyć architekturę multi-agent w akcji? Załóż darmowe konto w Smart-Copy.ai i zamów dłuższy tekst — na przykład 30 000 lub 50 000 znaków. Obserwuj, jak system automatycznie dobiera liczbę Pisarzy i generuje spójny, profesjonalny dokument. Od 3,99 zł za 1000 znaków, bez subskrypcji.

Manager + Pisarze — jak architektura multi-agent w Smart-Copy.ai generuje 150-stronicowe dokumenty