Công cụ tự động hóa của BuzzFeed

Ngọc Quỳnh
01/12/2020 - 10:00 5405     0

Bạn có bao giờ thắc mắc BuzzFeed đang sử dụng các quy trình tự động hóa như thế nào để đảm bảo rằng mọi nội dung đều có cơ hội tiếp cận đối tượng mục tiêu của họ? Bài viết là trải nghiệm thực tế của Freia Nahser - một biên tập viên tại Global Editors Network

Automating-BuzzFeed

AI và tự động hóa được BuzzFeed sử dụng như thế nào để thông báo các quyết định xuất bản trên nhiều trang của họ? Trong một cuộc họp với nhóm Nghiên cứu GEN tại Thành phố New York, Gilad Lotan - phó trưởng phòng khoa học dữ liệu của BuzzFeed cho chúng tôi xem qua một số bảng điều khiển nội bộ của họ, cũng như quy trình thử nghiệm AB

Quyết định dựa trên dữ liệu

BuzzFeed đã đầu tư rất nhiều các nền tảng phân phối nội dung bao gồm Twitter, Facebook, Snapchat, Instagram, Youtube và Pinterest. Họ có tổng 300 triệu người đăng ký trên YouTube, hơn 100 trang Facebook và BuzzFeed.com có ​​200 triệu khách truy cập hàng tháng.

Các nền tảng khác nhau này không chỉ được sử dụng để thúc đẩy lượt xem nội dung, mà còn được xem là nơi để thử nghiệm và từ đó áp dụng kinh nghiệm này cho các nền tảng khác.

“Điều này chỉ đạt hiệu quả nếu bạn thực sự thu thập dữ liệu về đối tượng mục tiêu. Vì vậy, những gì chúng tôi đã xây dựng là một kho dữ liệu khổng lồ về nghệ thuật và công nghệ. Chúng tôi đã thực sự đầu tư vào công nghệ nội bộ, điều này giúp chúng tôi hiểu cơ bản mọi nội dung mà chúng tôi xuất bản ở bất kỳ đâu trên một trang web: điều gì đang xảy ra với nó, cách mọi người tiếp cận nó và cách tiêu thụ nội dung thay đổi theo các mốc thời gian như thế nào”, ông Lotan nói.

Dữ liệu này sau đó được sử dụng để đưa ra quyết định nội bộ và đảm bảo rằng mọi phần nội dung đều có cơ hội ngang bằng để tiếp cận đúng đối tượng.

Cung cấp thông tin cho nhân viên

BuzzFeed có một số bảng điều khiển (dashboard) nội bộ sử dụng dữ liệu được thu thập từ kho thông tin của họ.

Một trong số đó được gọi là El Dashboard. Nó cho phép bất cứ nhân viên nào tại BuzzFeed nắm được hiệu quả của nội dung được đăng trên tất cả các nền tảng, bao gồm các mục đã được điều chỉnh và xuất bản lại. Ví dụ: El Dashboard có thể theo dõi một video đã được tạo cho Tasty, cũng như những video tổng hợp về chủ đề này trên YouTube. Người xem sau đó có thể có quyền truy cập và so sánh các biện pháp hiệu suất cho cả hai. Điều này giúp nhóm hiểu được các thành phần cốt lõi của nội dung: nơi nó được quảng bá, nơi nó được xuất bản và phản ứng của người đọc ra sao.

Automating-BuzzFeed

El Dashboard

Dashbird là một bảng điều khiển trực quan hơn, nó tính toán một số liệu được gọi là social lift. Đây là tỷ lệ giữa lượt xem lan truyền (lượt xem bên ngoài BuzzFeed) và lượt xem trả phí (lượt xem từ quảng cáo riêng của BuzzFeed). Dashbird cho phép người sử dụng biết được khi nào nội dung được xuất bản và xuất bản trên trang nào, đồng thời giúp họ phân tích thông tin dễ dàng hơn.

Automating-BuzzFeed

Dashbird

“Mọi người đều có thể áp dụng công cụ này vào công ty mình. Mọi người đều có quyền truy cập vào tất cả tính năng của Dashbird. Tôi nghĩ đó thực sự là một điều tuyệt vời. Một số công ty truyền thông muốn tác giả của họ biết được, nhưng quan trọng nhất là phải hiểu những gì khán giả phản hồi với nội dung. Và điều này đã ăn sâu vào văn hóa ở đây”, ông Gilad nói.

Tự động hóa, tự động hóa, tự động hóa

BuzzFeed có một bộ các mô hình dựa trên machine learning để giúp hướng dẫn quy trình xuất bản trên rất nhiều trang của họ.

1. Tái sử dụng, biến đổi, tái chế

"Chúng tôi nghĩ rất nhiều về việc điều chỉnh nội dung trên phạm vi quốc tế: làm thế nào để xác định được những nội dung đạt hiệu quả tốt nếu chúng tôi dịch nó sang ngôn ngữ khác?" - Lotan nói

BuzzFeed đã thu thập rất nhiều dữ liệu lịch sử trong những năm qua. Sử dụng hồi quy logistics và heuristics, mô hình mà họ đã xây dựng có thể dự đoán loại bài viết có thể có hiệu quả trong các ngôn ngữ khác. Ví dụ: nếu nhóm đang cố gắng xác định loại nội dung nào thích ứng để dịch từ ngôn ngữ tiếng Anh với ngôn ngữ Bồ Đào Nha, mô hình sẽ thông qua dữ liệu, bao gồm hiệu suất được phân chia theo quốc gia, tất cả các bài viết lịch sử và tất cả các bài viết đã được dịch từ tiếng Anh sang tiếng Bồ Đào Nha trong quá khứ và 'độ nóng' (hotness) sẽ được tạo ra dựa trên đầu ra của hồi quy logistic. Điểm nóng càng cao, bài viết sẽ càng thành công.

Automating-BuzzFeed

Độ nóng (Hotness)

Một bot nhắn tin sau đó thông báo cho biên tập viên về các đề xuất hợp lý. Và sau đó, nó tùy thuộc vào các biên tập viên để chọn có thực hiện hay không.

2. Tự động hóa thử nghiệm AB

Thử nghiệm AB testing của Buzzfeed cũng áp dụng một phần tự động hóa. Một công cụ AB testing được tích hợp vào CMS (Content Management System - Hệ thống quản lý nội dung) của họ và trong bất kỳ bài viết nào, người viết có thể sử dụng nếu họ muốn kiểm tra bất kỳ sự kết hợp nào giữa tiêu đề và hình ảnh. Kết quả của bài kiểm tra sau đó được gửi đến Slack, nơi các tác giả có thể thấy các tiêu đề và hình ảnh nào hoạt động tốt nhất trên bảng tin.

3. Máy móc học từ hành vi của con người

Xếp hạng nguồn cấp dữ liệu là một dịch vụ nội bộ tận dụng machine learning để đánh giá và làm nổi bật nội dung hấp dẫn nhất của BuzzFeed trên bảng tin.

Một thuật toán đa chức năng có thể lấy tất cả nội dung mới đã được xuất bản và sau đó dùng thử trên những điểm kiểm chứng trong một khoảng thời gian nhất định. Nó sẽ thu thập thông tin về hiệu suất và cách mọi người tương tác vào nội dung, bao gồm các lần click, thời gian dành cho một bài viết, tỷ lệ đọc hết bài viết và chia sẻ. Dựa trên những gì thuật toán học được, nó điều chỉnh vị trí của nội dung trên nguồn cấp dữ liệu. “Nó rất năng động và được củng cố bởi khán giả thực tế”, ông Lotan nói.

4. Cảm hứng từ việc sản xuất nôi dung tự động

Word2vec tận dụng các mạng lưới chính để hiểu các liên kết từ. BuzzFeed đã tạo ra một biến thể có tên là recipe2vec, được sử dụng cho Tasty để thêm những công thức nấu ăn liên quan vào một trang công thức.

Recipe2vec là một hệ thống nội bộ hiển thị các công thức nấu ăn tương tự bằng cách học các biểu diễn được vector hóa cho các từ trong kho công thức. Nó đưa vào các công thức nấu ăn sử dụng cùng một nguyên liệu, cùng cách thức chuẩn bị hoặc có hương vị tương tự

Ví dụ, thay vì nhóm tất cả các bữa ăn dựa trên thịt lợn với nhau, các công thức liên quan món thịt lợn nhồi tỏi và thảo mộc cũng có thể bao gồm món gà Fajita.

Automating-BuzzFeed

5. Tự động hóa lựa chọn nội dung và vị trí đăng bài

Công cụ nội bộ của BuzzFeed là Social Mission Control sẽ tự động xác định nội dung cụ thể nào sẽ đăng lên trang Facebook để quảng bá nội dung đó.

“Một số trong những trang này rất đồ sộ với hàng triệu triệu người theo dõi, vì vậy chúng tôi sử dụng nhiều dữ liệu lịch sử để giúp đưa ra cho những quyết định này” ông Lotan nói.

Hệ thống tự động hóa này hoạt động như thế nào?

BuzzFeed sử dụng trình phân loại từ để nhóm các từ có nghĩa tương tự với nhau

Khi các trình phân loại được lập trình với các từ về tất cả các chủ đề của BuzzFeed, chúng có thể bắt đầu xác định các địa điểm nhất định trên các trang khác nhau để quảng bá một số nội dung nhất định. Sau đó, tùy thuộc vào biên tập viên chấp nhận hoặc từ chối đề xuất. Nếu BuzzFeed không có ai chịu trách nhiệm quản lý một trang nào đó hoặc trang đó ít quan trọng hơn, quy trình này hoàn toàn tự động.

Tin tức liên quan và tái bản

BuzzFeed đang tiếp tục bổ sung thêm các tính năng công nghệ hiện đại vào các hệ thống xuất bản này, để làm cho chúng hiệu quả nhất có thể. Một ví dụ là tối ưu hóa tin tức liên quan. Ví dụ, trên BuzzFeed Animal, bạn có thể bắt gặp các từ “con chó” và “đáng yêu”, vì vậy các bài viết có chứa những từ này có thể được tự động khớp với trang này. Nhưng làm thế nào họ có thể chắc chắn rằng món bánh xúc xích (chilli dog bread ring) sẽ không xuất hiện trong số tất cả những con chó lông xù đáng yêu? Mạng lưới phân loại được đào tạo không chỉ để hiểu các từ mà hiểu còn quan hệ giữa chúng. Các từ liên quan đến bánh xúc xích sẽ được phân biệt với các từ trong đoạn nói về con vật, có nghĩa là chỉ số liên quan sẽ thấp, kết quả tìm kiếm sẽ thấp theo.

Automating-BuzzFeed

Các đề xuất nội dung thông thường cũng được tự động hóa, vì vậy nếu các biên tập viên cần xuất bản nội dung nhanh, họ có thể truy cập nhanh vào các bài viết có liên quan.

"Việc tái sử dụng nội dung của chúng tôi mang lại cho BuzzFeed một lợi thế lớn khi tham gia vào hệ sinh thái đa nền tảng này. Chúng tôi đã thấy một số kết quả đầy hứa hẹn. Đối với một số trang đầu tiên áo dụng quy trình tự động hóa hoàn toàn, chúng tôi đã xem đó là kết quả tốt, dù chỉ là tốt hơn một chút", Lotan nói.

"Chúng tôi đã thấy sự tăng trưởng về số lượng các nội dung được xuất bản trên các trang này. Và do đó, chúng tôi đã phân phối hiệu quả hơn nội dung của chúng tôi đến đúng đối tượng theo cách này. Rất nhiều chúng bị lãng quên, bởi vì chúng tôi có rất nhiều mục được xuất bản mỗi ngày. Khi bạn có nhiều nơi bạn có thể xuất bản những nội dung này, những công cụ này sẽ trở nên thực sự có ảnh hưởng"

"Vào cuối ngày, những con người sáng tạo vẫn có toàn quyền kiểm soát và có thể quyết định các đề xuất do máy đưa ra", Lotan nói. Theo ông, những người làm việc tại BuzzFeed không hề cảm thấy công việc của mình đang bị các cỗ máy chiếm đoạt. Các công cụ đã làm giúp những thứ nhàm chán nhất để con người có thêm thời gian xây dựng chiến lược.

Ngọc Quỳnh
Ngọc Quỳnh