Chuyển đến nội dung chính
  1. Các bài viết của tôi/

Cung cấp Nội dung Cá nhân hóa: Công cụ Đề xuất Mới của Momspresso

Trong thế giới số giàu nội dung ngày nay, việc cung cấp đúng nội dung cho đúng người dùng vào đúng thời điểm là rất quan trọng. Dựa trên công việc trước đây của chúng tôi về đường ống dữ liệu của Momspresso, chúng tôi đã triển khai một công cụ đề xuất mạnh mẽ để cá nhân hóa nội dung cho hàng triệu người dùng Momspresso. Hãy cùng tìm hiểu cách chúng tôi xây dựng hệ thống này.

Thách thức #

Momspresso cần một hệ thống đề xuất có thể:

  1. Xử lý khối lượng lớn dữ liệu tương tác của người dùng
  2. Tạo ra các đề xuất bài viết cá nhân hóa nhanh chóng
  3. Cập nhật đề xuất theo thời gian thực khi người dùng tương tác với nội dung
  4. Mở rộng để xử lý hàng triệu người dùng và bài viết

Giải pháp của chúng tôi: Công cụ Đề xuất Được hỗ trợ bởi Spark #

Chúng tôi đã thiết kế một hệ thống đề xuất đa thành phần tận dụng đường ống dữ liệu mà chúng tôi đã xây dựng trước đó:

1. Các Script Tạo Dữ liệu #

Sử dụng kho lưu trữ sự kiện từ đường ống dữ liệu của chúng tôi, chúng tôi đã tạo ra các script để tạo tập dữ liệu huấn luyện cho mô hình đề xuất của chúng tôi. Điều này cho phép chúng tôi sử dụng dữ liệu tương tác thực tế của người dùng để huấn luyện mô hình.

2. Spark ML-lib cho Huấn luyện Mô hình #

Chúng tôi đã thiết lập một hệ thống dựa trên Spark ML-lib để huấn luyện mô hình. Hiện tại, chúng tôi đang sử dụng lọc cộng tác, có thể được huấn luyện nhanh chóng chỉ với 3-4 ngày dữ liệu. Điều này cho phép chúng tôi cập nhật mô hình thường xuyên, đảm bảo các đề xuất của chúng tôi luôn phù hợp.

3. Dịch vụ Web Đề xuất #

Chúng tôi đã xây dựng một dịch vụ web cung cấp các đề xuất bài viết dựa trên ID người dùng. Để giải quyết vấn đề độ trễ cao khi tải mô hình vào bộ nhớ, chúng tôi đã triển khai chiến lược bộ nhớ đệm sử dụng Redis. Điều này đảm bảo thời gian phản hồi nhanh cho các đề xuất của chúng tôi.

4. Dịch vụ Xóa Đề xuất #

Để giữ cho các đề xuất luôn mới, chúng tôi đã triển khai một dịch vụ xóa các bài viết đã xem khỏi đề xuất của người dùng. Dịch vụ này kết nối với Kafka và lắng nghe các sự kiện xem, cập nhật đề xuất theo thời gian thực.

Các Tính năng Chính của Công cụ Đề xuất của Chúng tôi #

  1. Cá nhân hóa: Bằng cách sử dụng lọc cộng tác, chúng tôi có thể cung cấp các đề xuất phù hợp dựa trên hành vi của những người dùng tương tự.

  2. Cập nhật Thời gian Thực: Hệ thống của chúng tôi cập nhật đề xuất khi người dùng tương tác với nội dung, đảm bảo tính phù hợp.

  3. Khả năng Mở rộng: Việc sử dụng Spark và Redis cho phép hệ thống của chúng tôi xử lý hiệu quả khối lượng lớn dữ liệu và người dùng.

  4. Linh hoạt: Thiết kế mô-đun của chúng tôi cho phép dễ dàng thay đổi thuật toán đề xuất hoặc thêm các tính năng mới trong tương lai.

Triển khai và Kết quả #

Việc tích hợp công cụ đề xuất với nền tảng Momspresso khá đơn giản. Chúng tôi đã thực hiện một thay đổi cấu hình nhỏ trong Nginx để sử dụng dịch vụ web đề xuất mới của chúng tôi làm API cho một trong các nguồn cấp dữ liệu trên trang web sản phẩm.

Kết quả ban đầu rất đáng khích lệ:

  • Tăng Tương tác: Người dùng dành nhiều thời gian hơn trên nền tảng, đọc nhiều bài viết hơn trong mỗi phiên.
  • Cải thiện Khám phá: Người dùng tìm thấy và tương tác với nhiều loại nội dung đa dạng hơn.
  • Nâng cao Sự hài lòng của Người dùng: Phản hồi ban đầu cho thấy người dùng thấy các đề xuất cá nhân hóa có giá trị.

Hướng Tới Tương lai #

Khi chúng tôi tiếp tục cải tiến công cụ đề xuất, chúng tôi rất hào hứng về một số cải tiến trong tương lai:

  1. Phương pháp Đa mô hình: Triển khai các mô hình đề xuất khác nhau cho các loại nội dung hoặc phân khúc người dùng khác nhau.
  2. Lọc Dựa trên Nội dung: Kết hợp các đặc điểm bài viết để cải thiện đề xuất, đặc biệt là cho nội dung mới hoặc ngách.
  3. Khung Thử nghiệm A/B: Xây dựng một hệ thống để dễ dàng thử nghiệm các chiến lược đề xuất khác nhau.

Bằng cách liên tục cải thiện công cụ đề xuất, chúng tôi đang giúp Momspresso mang lại nhiều giá trị hơn cho người dùng của họ, giữ họ tương tác và quay lại để xem thêm nội dung cá nhân hóa.

Hãy đón đợi bài đăng tiếp theo của chúng tôi, nơi chúng tôi sẽ thảo luận về cách chúng tôi đang sử dụng đường ống dữ liệu và công cụ đề xuất để rút ra những hiểu biết có thể hành động cho chiến lược nội dung của Momspresso!