1. Trí tuệ nhân tạo (AI) là gì?
Là một nhánh của khoa học máy
tính xử lý mô phỏng cách hành động thông minh của con người. Nhìn chung, AI
được định nghĩa như khả năng để thực hiện các nhiệm vụ mà các nhiệm vụ đó cần
trí tuệ giống như của con người, bao gồm nhận dạng (recognition) hình ảnh và
lời nói, chữ viết, suy luận logic, và khả năng ra quyết định dựa trên kinh
nghiệm đã qua. Thay cho việc thực hiện đơn giản tập cố định các khai báo đã
được mã hóa cứng thành phần mềm, các hệ thống dựa trên AI có khả năng
"học" về các nhiệm vụ và các tập dữ liệu, và thích ứng hoạt động
(behavior) để tối ưu hóa kết quả và xử lý có khả năng suy luận và ra quyết định
như con người.
Các thành phần của Trí tuệ nhân tạo
Công nghệ AI tới thời điểm hiện
tại được chia ra mấy nhánh cơ bản như sau:
Học máy (Machine learning)
Là một dạng của trí tuệ nhân tạo
cho phép các hệ thống (các ứng dụng phần mềm) có thể học tập từ các dữ liệu
được cung cấp, chúng có khả năng ghi nhớ, suy luận, và suy diễn để đưa ra các
quyết định từ những kiến thức đã học được.
Hình 1: Các hệ thống Machine Learning
Học sâu (Deep learning)
Là một nhánh con của học máy, học
sâu dùng các mạng có khả năng học từ dữ liệu mà dữ liệu đó là không cấu trúc
hoặc không được dán nhãn (hay thẻ - unlabeled data). Học sâu thực hiện phương
pháp trực giác để dạy các thuật toán xử lý dữ liệu, tương tự với một số phương
pháp mà con người học. Phương pháp có thể phân phối các kết quả ấn tượng, nhưng
nhược điểm đó là chiếm nhiều dữ liệu để đào tạo các thuật toán. Đó là lý do mà
các nhà khoa học dữ liệu cần công suất xử lý của GPU để đào tạo các mô hình để
học sâu.
Mạng tế bào thần kinh
Là một hệ thống máy tính, được mô
hình hóa theo hệ thống thần kinh và bộ não của con người, chứa một số khối xử
lý kết nối để phân tích thông tin và cho ra các kết quả thống kê có điều chỉnh
(bằng cách bổ sung giá trị) để dẫn tới đầu ra cuối cùng.
Chatbot
Chatbot (thuộc khoa học máy tính,
hoặc gọi tắt là "bot") là sự mô phỏng con người để nói chuyện qua
phòng chat, hoặc "chương trình máy tính thực hiện hội thoại qua phòng
chat".
1. Xu hướng của AI trong tương lai.
AI có tiềm năng rất thực tế và rất thú vị để
tác động vào cuộc sống hàng ngày của chúng ta. Công ty IDC (International Data
Corporation) dự đoán chi phí cho AI sẽ là khoảng 13 tỷ USD trong năm 2017, và
sẽ tăng gần 3 lần, tới khoảng 46 tỷ US vào năm 2020.
2. Ví sao các công ty M&E truyền thống cần áp dụng AI?
Với sự bùng nổ của các thiết bị
di động thông minh (Smartphone) và việc mở rộng không ngừng của băng thông mạng
Internet cũng như Các công nghệ thông tin di động như 3G, 4G và tiến tới 5G
cũng như con người ta ngày các bận bịu và năng động hơn cho lên việc trải
nghiệm báo trí cũng như video của con người đã thay đổi rất nhanh trong những
năm gần đây. Một khảo sát gần đây của công ty IBM (đầu năm 2017) với gần 21.000
người ở 42 nước khẳng định rằng họ xem video trên Internet bằng các thiết bị di
động ngày càng tăng nhanh theo thời gian.
Một số công ty đột phá số trên thế giới (Digital Disruptor) như Netflix,
Amazon, Facebook, Google và Snapchat đã nắm lấy thời cơ về về việc thay đổi
cách thức xem cũng như trải nghiệm của
người tiêu dùng đối với video để đưa ra những giải pháp về xem cũng như trải
nghiệm video một cách thông minh và họ đã có một lượng lớn khách hàng. Trong
thực tế, họ đã điều chỉnh các kỳ vọng của khách hàng đối với công nghiệp media
và giải trí (Media and Entertainment – M&E) và hiện giờ họ đang cạnh tranh trực
tiếp với các công ty M&E truyền thống và có sự ủng hộ tích cực và tiền của
người tiêu dùng.
Muốn đối chọi lại với các
"đột phá số" các công ty M&E truyền thống hiểu rõ rằng trước tiên
họ phải giữ được khách hàng hiện tại của họ. Họ hiểu rằng khách hàng ngày nay
mong muốn, và thậm chí đòi hỏi, các trải nghiệm lôi kéo, hấp dẫn và cá nhân hóa
khi xem video. Để phân phối các dịch vụ
cá nhân hóa đúng lúc, các công ty M&E phải thu thập và phân tích một khối
lượng lớn dữ liệu có liên quan đến mong muốn cũng như đòi hỏi của người tiêu trong
thời gian thực. Với công nghệ nhận thức (cognitive technology- một nhánh con
của trí tuệ nhân tạo) họ có thể thu thập, phân tích một khối lượng lớn dữ liệu
của khách hàng và cũng như nội dung mà họ cần, và đưa ra những nhận định phù
hợp với sự quan tâm của khách hàng tới nội dung liên quan, chính xác hơn cả về
thời điểm, thời gian mà khách hàng mong muốn so với khi không có công nghệ này.
Giả sử, các tổ chức media thành
công trong việc tạo ra một hệ thống để phân tích và đưa ra những nhận định về
sự quan tâm cũng như mong muốn của khách hàng, thách thức tiếp theo họ phải đối
mặt là làm sao hệ thống xử lý media của họ có thể giải quyết khối lượng nội dung cũng như các
dòng làm việc (workflow) khổng lồ để
cung cấp ngược lại nội dung theo mong muốn của khách hàng. Muốn vậy các công ty
media sẽ cần xây dựng các hệ thống Cloud lai ghép siêu co giãn (hyperscalable
hybrid cloud system) và hệ thống có khả
năng nhận thức để quản lý và xử lý media tăng lên bất thình lình để phân phối
nội dung video mục tiêu mà khách hàng của họ muốn.
Để làm được điều đó họ phải làm
cho các hệ thống (back-end) phải thông
minh hơn để xử lý cũng như thu thập, phân tích các thị hiếu của khách hàng. Các
công nghệ mới mẻ như các giải pháp về công nghệ tự nhận thức và blockchain đang
có vai trò ngày càng tăng trong việc xử lý khối lượng lớn dữ liệu và đưa ra
quyết định sẽ làm giảm chi phí cũng như con người vận hành. Các công cụ nhận thức
đang mang lại hiệu quả đáng kể cho các công ty như Netflix, BBC và Masters
Tournament. Còn Blockchain hỗ trợ tạo nguồn thu hiệu quả hơn bằng việc đảm bảo
người đúng thì được nhận xuyên suốt hệ sinh thái media.
Từ phân tích trên có thể nói các công ty M&E truyền thống phải chuyển
đổi các mô hình kinh doanh của họ để đáp ứng với các kỳ vọng và thị yếu mới của
khách hàng. Tính cấp bách của việc "tạo ra phiên bản số mới" (Digital
ReinventionTM), và tạo ra các trải nghiệm mới trải nghiệm thông
minh hơn và làm cho khách hàng xem những gì mình thích, vào thời điểm và thời
gian mình thích mà không quá tốn công và chi phí tìm kiếm.
Các công ty M&E áp dụng công nghệ trí tuệ nhân tạo (AI) để có công
cụ để hiểu biết sâu sắc về kỳ vọng và thị hiệu của khách hàng (Audience
insights), hiểu biết sâu sắc về nội dung, để dự đoán và cung cấp nội dung phù
hợp (Content prediction and matching). Họ phải dùng sức mạnh của công nghệ
Cloud và công nghệ AI để phân phối đa kênh/ đa thiết bị, để tự động hóa dòng
làm việc hiệu quả. Họ phải thiết kế lại các hệ thống back-end để tối ưu hóa
nguồn thu quảng cáo, nguồn thu nội dung, tạo ra phiên bản số rộng lớn hơn cũng
như giảm chi phí sản xuất nội dung cũng như giảm chi phí cho khách hàng.
Trí tuệ nhân tạo có vai trò rất quan
trọng trong việc giúp các công ty M&E truyền thống lấy lại vị trí của mình
trong thị trường giải trí video đang cạnh tranh ngày càng khốc liệt hiện nay
cũng như trong những năm tới.
Trí tuệ
nhân tạo – Một trong những công nghệ quảng bá "nóng" trong năm 2018
Thị trường truyền hình ngày càng
khốc liệt khi các công ty về cung cấp sản phẩm truyền hình trên Internet đang
bùng nổ chóng mặt trong các năm qua. Và các công nghệ trong truyền hình cũng
thường xuyên được nâng cấp và ra đời những sản phẩm mới. Quan sát các Hội chợ,
các triển lãm công nghệ, đặc biệt là các sự kiện lớn như NAB 2017 hay IBC 2017.
Thì công nghệ thực tế ảo (Virtual Reality – VR) và công nghệ thực tế tăng cường
(Augmented Reality – AR) và Trí tuệ nhân tạo (AI), các thiết bị điều khiển bởi
giọng nói (voice-controlled devices) đã và đang được người tiêu dùng trải
nghiệm và gia tăng một cách nhanh chóng.
Các công nghệ như VR, AR, và các thiết bị điều khiển bằng giọng nói đang
trở thành các phần tương tác (ở các mức khác nhau) của cuộc sống hàng ngày của
người xem. Các công nghệ khác, như AI, có thể giúp cải thiện trải nghiệm xem từ
phía sau những gì đang diễn ra trên các màn hình (from behind the scenes). Các
công nghệ này có tiềm năng thay đổi lớn cách mà chúng ta giải trí và đó là xu
thế của công nghiệp giải trí trong tương lai không xa.
Vai trò của AI trong việc xem video.
Với các công nghệ dán nhãn (tagging: ghi tên và địa
chỉ) metadata tiên tiến, AI có thể phân tích rất nhiều dữ liệu, hiểu chính xác
video bao gồm cái gì, và phát hiện ra tầm hiểu biết sâu sắc đáng ngạc nhiên về
cái đã làm cho nội dung này thành công giữa những người xem. Bằng việc thu thập
và phân tích dữ liệu từ video hệ thống AI để giúp cho ra quyết định cần cho xem
loại nội dung nào, ở thời điểm nào, tới khách hàng nào.
Hệ thống AI có thể thu thập và xử
lý và phân tích một lượng lớn dữ liệu của người xem do đó sẽ đưa ra được những
khuyến cáo cho các nhà sản xuất nội dung cần sản xuất nội dung gì để phụ hợp
với thị hiếu của người xem trong một khoảng thời gian nhất định.
1.
Một số giải pháp ứng dụng AI trong đơn vị M&E truyền
thống.
Để tối ưu hóa các dòng làm việc media và giải trí, thì
dữ liệu để thu thập và phân tích là
metadata. Metadata có thể bao gồm một mẩu thông tin bất kỳ về một Media. Ví dụ,
metadata cho video có thể chứa các thuật ngữ bản quyền, Mô tả, Các timecode cảnh,
Các thông tin tập (series)/đoạn(episode), Thông tin sự kiện … Vậy làm thế nào để
có thể thu thập tất cả các thông tin Metadata liên quan tới Media a rồi phân
tích, phỏng đoán, suy đoán.. Hệ thống AI sẽ giúp chúng ta làm điều đó. Hãy hình
dung rất nhiều thông tin metadata việc nhập dữ liệu thủ công, Thường để có một
giờ nội dung thì phải mất bốn giờ lao động thủ công để capture và nhập metadata
cho media đó. Điều này đang thay đổi nhờ việc tạo metadata tự động dựa trên nền
tảng của nhiều công ty, ví dụ như giải pháp của Microsoft và Ooyala như trình
bày dưới đây.
Microsoft Video Indexer
Các nền tảng (platform) như Microsoft Azure Cognitive
Services đang đi đầu trong việc sao chép tiên tiến và nhận dạng bộ mặt, đối tượng
và text để tạo ra (capture) metadata chính yếu một cách tự động. Chắc chắn công
nghệ này sẽ được sử dụng để ingest nội dung VOD và lưu trữ metadata xung quanh
nó, nhưng ví dụ thời gian thực thú vị hơn khi xảy ra trong các sự kiện trực tiếp,
ở đó chương trình AI có thể nhận dạng ngay tức khắc điểm dữ liệu (datapoint)
chính và hành động trên nó trong trình tự rất ngắn. Ví dụ, nếu một diễn viên
ngôi sao của phim xuất hiện trong đám đông ở một trận đấu bóng rổ, AI có thể
kéo clip phim thông dụng nhất của ngôi sao đó, kiểm tra bản quyền và chuẩn bị
cho phát sóng … tất cả trong vài phút, nếu không nói là vài giây.
Việc cài đặt nền tảng cho tạo và quản lý dữ liệu hợp
lý là điều quan trọng trong quản lý và phân phối Media. Điều này bắt đầu với
engine nắm bắt dữ liệu như Microsoft Video Indexer của công ty Microsoft và
Ooyala Flex của công ty Ooyala
Với Ooyala Flex thì chìa khóa ở đây là tự động hóa.
Ngay khi bạn có dữ liệu, Ooyala Flex có thể giúp để tổ chức cấu trúc dữ liệu
tiên tiến khi mô hình hóa các cơ cấu làm việc (framework) để cài đặt các quan hệ
và các quy tắc dòng làm việc, những cho phép đơn giản hóa và làm hiệu quả quá
trình ra quyết định phức tạp. Các nhiệm vụ đã từng là phức tạp có thể được hợp
lý hóa và các quyết định được ra hiệu quả hơn nhiều, thậm chí thường là tự động.
Hiện tại Ooyala đang làm việc trực tiếp với Microsoft Azure Cognitive Services
để thu thập metadata chính như bản sao (transcript) audio, dữ liệu khuôn mặt, đối
tượng và nhận ra text. Dữ liệu này được capture bởi công nghệ Microsoft Video
Indexer và chuyển sang Ooyala Flex để lưu trữ và quản lý.
Ngay khi có mặt trong Ooyala Flex, các giá trị dữ liệu
quan trọng này có thể được sử dụng để di chuyển trong chu trình sản xuất và phân
phối sao cho hiệu quả nhất có thể. Các nhiệm vụ được thực hiện nhanh hơn, các
câu hỏi công việc được trả lời hiệu quả hơn và giá thành được giảm thiểu. Đó là
tương lai của cung ứng dịch vụ media.
Một ví dụ thực tế:
ZoneTV đang dùng các công cụ cung ứng dịch vụ media từ
Ooyala cộng với Video Indexer, một phần của Microsoft Cognitive Services, để tự
động hóa việc dẫn hướng (curation) nội dung của hệ các kênh truyền hình tuyến
tính, có khả năng theo yêu cầu của khách hàng, hệ thống đưa vào sử dụng mùa hè
năm 2017.
Dịch vụ đặc biệt này của ZoneTV cho phép khách hàng có nhiều lựa
chọn hơn, khi kết hợp (combining) việc lựa chọn xem các kênh tuyến tính, các kênh theo yêu cầu và các kênh chủ động phục
vụ thị hiếu khách hàng tại từng thời điểm "Các kênh động của ZoneTV"
(ZoneTV Dynamic Channels). Hệ thống có khả năng dẫn hướng đồng thời 6.000 giờ
video ngay lập tức theo thị hiếu của từng khách hàng đang xem tạo ra trải nghiệm
tuyệt vời và cá nhân hóa cho cho khách hàng. ZoneTV sẽ thực hiện điều này khi
dùng ZoneTV Programming Studio, được tích hợp với Ooyala Flex và Video Indexer
để dẫn hướng các kênh chuyên biệt được tinh chỉnh này.
Việc kết hợp các công cụ này đề cao các thuật toán
tiên tiến, những thuật toán mô tả nội dung; phương thức trích và phân tích tự động
metadata để nhận dạng loại video và tính chất truyền cảm của nội dung, kéo các
chủ đề từ lời nói và text, sao chép các tiêu đề (caption) thành nhiều ngôn ngữ
và tích hợp các phân tích thuê bao. Điều này cung cấp sự mở rộng nhanh của
ZoneTV khi nó thêm vào nội dung bổ sung, và giảm các quá trình thủ công mà các
quá trình đó có thể làm chậm việc dẫn hướng nội dung và đưa vào các lỗi trong
sao chép và ứng dụng metadata.
Hình 4: Quy trình mẫu triển
khai AI trên nền tảng Cloud OTT
Phòng KTDA