/Bài viết

Vì sao tôi không còn kêu ChatGPT vẽ ảnh tự do nữa dù nó vẽ rất đẹp

Có một thời gian dài tôi làm ảnh minh họa kiểu này: viết xong bài, copy nguyên cái nội dung, quăng vô ChatGPT rồi gõ một câu “vẽ giùm tôi cái ảnh minh họa cho bài này”.

Rồi ngồi chờ.. hên xui :))

Nói thiệt, ảnh nó ra đẹp. Đẹp lung linh là đằng khác. Mà xài hổng được.

Lúc thì nó nhồi chữ vô đầy ảnh, đọc trên điện thoại muốn lòi con mắt. Lúc thì nó cắt mất cái ý quan trọng nhất, giữ lại mấy thứ trang trí cho vui. Mấy bài tôi cần một cái CTA rõ ràng ở cuối thì nó đặt điểm nhấn trớt quớt đâu đâu, đọc xong hổng biết phải làm gì tiếp.

Tệ nhất là: mỗi lần một kiểu. Bài này màu nóng, bài kia màu lạnh, bài nọ nét vẽ khác hẳn. Gom 5 bài lại nhìn như 5 người khác nhau làm. Không ra được cái bộ nhận diện gì hết.

--> Tới một lúc tôi mới nhận ra vấn đề không nằm ở chỗ AI vẽ dở. Nó vẽ giỏi thấy bà. Vấn đề là tôi đang giao cho nó một việc mà không đưa cái khung để nó làm đúng.

Khúc Ngoặt: Dạy AI Cách Nghĩ Trước Khi Vẽ

Nên tôi đổi cách. Thay vì kêu nó vẽ, tôi quay qua dạy nó cách nghĩ trước khi vẽ.

Cụ thể là tôi đóng gói một cái “skill”, thực ra là một system prompt dài, đặt vô Project. Trong đó tôi không nói “vẽ cho đẹp”. Tôi bắt nó đi qua đúng 6 bước, y như cách một người làm thiết kế thiệt thụ sẽ nghĩ trước khi cầm cọ.

Để tôi kể từng bước.

6 Bước Tôi Bắt AI Đi Qua

1. Phân tích nội dung

Bước đầu nó không được vẽ liền đâu. Nó phải đọc nội dung, chắt ra một thông điệp chính, cái ý mà người xem phải hiểu trong vòng 3 giây. Một tấm ảnh ôm 5 ý là một tấm ảnh không có ý nào hết. Bước này ép nó, mà thật ra ép luôn cả tôi, phải chốt: bài này rốt cuộc muốn nói một câu gì?

2. Chọn style

Đây là chỗ trị cái bệnh “mỗi lần một kiểu”. Tôi không để AI tự bịa phong cách theo hứng. Tôi đưa sẵn một thư viện 7 style cố định, mỗi cái có nhiệm vụ riêng: ACD cho ảnh tương phản kiểu hook, before/after; WEC cho cover sang, ít chữ; SBS cho một insight duy nhất; SB cho dạng liệt kê nhiều ý; FBW cho quy trình từng bước; BLD cho sơ đồ framework; VTK cho bản đồ kiến thức sâu.

Nó chỉ được chọn trong số đó, dựa trên loại nội dung. Cái nhất quán của cả bộ ảnh đẻ ra từ đây chứ đâu.

3. Dựng Visual Blueprint

Trước khi đụng vô vẽ, nó phải tự trả lời mấy câu: thông điệp 3 giây là gì, ẩn dụ chính là cái gì (đòn bẩy, cổ chai, ngã ba đường..), bố cục sắp ra sao, chữ nhiều hay ít, cái CTA đặt chỗ nào.

Đây là khúc tôi tâm đắc nhất. Vì cái lỗi nhồi chữ hay vẽ đẹp mà vô dụng gần như biến mất khi mình bắt nó nghĩ bố cục TRƯỚC, thay vì vẽ xong rồi mới tính.

4. Quality Gate

Chấm điểm.. trước khi vẽ. Mấy tiêu chí đơn giản: thông điệp có rõ trong 3 giây không, ẩn dụ có đủ mạnh không, chữ có dễ đọc trên điện thoại không, có đúng chất của style đã chọn không. Dưới ngưỡng là không cho ra.

Giống như có một ông biên tập khó tính ngồi gác cửa, chưa đạt thì khỏi đi tiếp.

5. Tinh chỉnh

Rớt quality gate thì quay lại sửa cái blueprint rồi chấm lại, tối đa 1-2 vòng. Không phải vẽ đại một phát rồi thôi, đẹp xấu tính sau.

6. Ra ảnh cần dùng

Qua hết mấy cửa đó nó mới được vẽ. Và cái ảnh ra.. đúng là cái tôi cần xài, chứ không phải cái đẹp cho vui.

(cái ảnh này là một ví dụ, tôi vẽ bằng chính cái skill đó)

Vì sao cái khung lại ăn đứt việc vẽ tự do

Gói lại thì cái khung này được 3 thứ mà vẽ tự do không có:

  1. Nhất quán: 7 style cố định, gom cả chục bài lại vẫn cùng một chất, ra được bộ nhận diện.

  2. Đỡ sửa: hồi trước tôi gần như phải vẽ lại hoặc sửa te tua, giờ phần lớn xài được luôn hoặc chỉ chỉnh nhẹ.

  3. Ảnh phục vụ thông điệp: nó không còn vẽ cho đẹp, nó vẽ cho ra ý.

Nói cho dễ hình dung: AI vẽ tự do giống mình thuê một họa sĩ giỏi, mà mỗi lần kêu vẽ là ổng quên sạch mình đang làm cho thương hiệu nào, vẽ theo hứng. Còn đưa cái khung giống đưa cho ổng cái brand guideline với cái brief rõ ràng. Cũng ông họa sĩ đó, mà kết quả khác hẳn.

Mà Nói Vậy Thôi..

Tôi không có bắt “ai cũng phải làm cái khung này”. Xây nó tốn công thiệt. Tôi ngồi mò mấy buổi mới ra được cái thư viện style với quality gate cho ưng cái bụng, mà vẫn còn đang chỉnh tiếp.

Với ai chỉ cần một tấm ảnh xài một lần, viết nguyên cái khung này là.. overkill. Quăng ChatGPT một câu cho lẹ, có khi còn nhanh hơn nhiều.

Cái khung chỉ đáng công khi anh em làm đi làm lại, ra ảnh đều đặn, và cần nhất quán. Tôi đoán mò là nó hợp với người làm content thường xuyên thôi, chứ hổng phải ai cũng cần đâu ^^

Vẽ ảnh hay viết prompt, cũng một tư duy

Viết tới đây tôi mới thấy nó y chang cái chuyện tôi kể trong bài cấu trúc prompt 8 tầng hồi trước: khác biệt giữa “giao việc” cho AI và “thiết kế một hệ thống làm việc” với nó.

Kêu một câu “vẽ giùm” là giao việc. Dựng 6 bước để nó nghĩ trước khi vẽ là thiết kế hệ thống. Cái đầu nhanh, cái sau lâu hơn.. nhưng ra kết quả khác hẳn.

Tiện đây hỏi anh em: mình đang “kêu AI vẽ giùm” hay đang “dạy AI cách mình muốn nó vẽ”?

#voquoccuong

Nội dung đính kèm:

Bài viết đăng lần đầu trên Substack →

Bài viết liên quan