Lumiere của Google tạo video AI thực tế từ lời nhắc văn bản

văn hóa
Thiết kế
Đăng ngày 30 tháng 2024 năm XNUMX

Tín dụng: Google Lumiere

By Jamie Watts

London, Vương quốc Anh

1 năng lượng + Thêm năng lượng

0 comments

Video AI đang nhanh chóng chuyển từ thung lũng kỳ lạ sang thực tế thực sự và Lumiere của Google là trình tạo chuyển văn bản thành video phức tạp nhất mà chúng tôi từng thấy cho đến nay.

Gây ra cảm giác kinh ngạc – và một chút lo lắng – Google gần đây đã cho thấy video AI đã trở nên phức tạp như thế nào chỉ sau vài năm phát triển.

Theo cách tương tự mà các trình tạo văn bản thành hình ảnh như Bing Image Creator, DALL-E và Midjourney có thể tạo hình ảnh gốc từ lời nhắc một dòng, ' của Googlelumiere' ứng dụng có thể biến những ý tưởng điên rồ nhất của chúng tôi thành video được hiển thị đầy đủ năm giây.

Các ví dụ khác về trình tạo văn bản thành video đã có sẵn, nhưng nỗ lực của Google là nỗ lực đầu tiên thực sự mô tả chính xác chuyển động theo tiêu chuẩn CGI.

Nó đạt được điều này bằng cách thiết lập một khung cơ sở và sử dụng STUNet (Space-Time-U-Net) để tự động thiết lập các mục trong hình ảnh sẽ di chuyển như thế nào. Sau khi được chọn, các đối tượng trong khung ban đầu đó sẽ bao gồm một số lớp của riêng chúng liên kết với nhau một cách liền mạch.

https://youtu.be/wxLr02Dz2Sc

Lumiere có thể tạo ra 80 khung hình cho mỗi hình ảnh so với mức tối đa trước đó là 25 khung hình mà đối thủ cạnh tranh gần nhất là Stable Video Diffusion đạt được. Mặc dù một số kết quả ban đầu do Google công bố có chút giả tạo, nhưng bước nhảy vọt về chất lượng tổng thể kể từ khi nó được đưa ra. KHÔNG phải bản demo đang loạng choạng.

Ngoài chuyển văn bản thành video, còn có cách tạo hình ảnh thành video sẽ mang lại hình ảnh tĩnh sống động, thế hệ cách điệu, có thể tạo video theo một phong cách hình ảnh cụ thể và cài đặt máy quay phim có thể tạo hoạt ảnh cho một phần cụ thể của hình ảnh hiện có – chẳng hạn như nước chảy, ngọn lửa bập bùng hoặc khói từ động cơ xe lửa.

Về mặt chiến lược thị trường, sự xuất hiện muộn của Lumiere phù hợp với chính sách muộn màng thời thượng của Google. Kể từ lần lặp đầu tiên của công cụ ngôn ngữ tổng quát của nó Bard thất bại Năm ngoái, gã khổng lồ công nghệ đã âm thầm phát triển tầm nhìn đa phương thức của mình cho AI tạo ra nền tảng.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

Thông báo mới nhất của nó theo sát sự giới thiệu mô hình ngôn ngữ Gemini của Google, được cho là sẽ tạo ra thách thức muộn màng cho vương miện của ChatGPT làm chuẩn mực cho lĩnh vực này.

Nhìn xa hơn những tin đồn thương mại về AI video, sẽ thật thiếu sót nếu bỏ qua khả năng lạm dụng công nghệ này vì việc phân biệt tác phẩm hư cấu với nội dung đời thực ngày càng khó khăn hơn.

Sự thất bại đang diễn ra liên quan đến các mô tả khiêu dâm về Taylor Swift và khả năng sử dụng ứng dụng chuyển văn bản thành hình ảnh của cô ấy có thể chỉ là phần nổi của tảng băng chìm nếu tính năng chuyển văn bản thành video phát triển ở quy mô tương tự.

Google đảm bảo rằng họ đang tạo ra các biện pháp bảo vệ để đảm bảo sử dụng hợp lý Lumiere, nhưng các tác giả của bài báo vẫn chưa phê chuẩn chính xác cách ngăn chặn sự cố. Chúng tôi rất mong muốn có được công nghệ này, nhưng không phải liệu nó có mở được hộp sâu lớn hơn hay không.

Jamie Watts

Biên tập viên công nghệ London, Vương quốc Anh

Tôi là Jamie (Anh ấy / Anh ấy), Phó Tổng biên tập và Nhà văn cấp cao tại Thred. Cập nhật thông tin cập nhật trên mạng xã hội và công nghệ mang tính cách mạng là sở trường của tôi, nhưng khi rời khỏi bàn phím, bạn có thể sẽ thấy tôi bị cuốn vào một vụ nổ băng Tango lớn trong bộ phim kinh dị tầm thường mới nhất. theo tôi trên Twitter, LinkedIn và gửi cho tôi một số ý tưởng / phản hồi qua e-mail.

Thêm từ thred.

Tín dụng: Unsplash

phong cách sôi nổi

Giải thích sự gia tăng của du lịch ngủ

Nhanh chóng trở thành một trong những xu hướng lớn nhất trong ngành chăm sóc sức khỏe, ngày càng có nhiều khách du lịch từ bỏ những hành trình đầy ắp các hoạt động để chuyển sang thực đơn gối và ngủ sớm. Một kỳ nghỉ có thể có nhiều thứ; đối với một số người, nó liên quan đến việc khám phá, phiêu lưu và thử ẩm thực địa phương. Đối với những người khác, đó là cơ hội để ngồi lại và thư giãn, không làm gì khác ngoài việc nằm dài bên hồ bơi trong một hoặc hai tuần trước khi...

By Sofia Phillips London, Vương quốc Anh

Việc sử dụng AI không được tiết lộ của Netflix gây ra cuộc tranh luận về thao túng truyền thông

Tín dụng: Thred

Phương tiện truyền thông

Việc sử dụng AI không được tiết lộ của Netflix gây ra cuộc tranh luận về thao túng truyền thông

Netflix đã bị chỉ trích vì đưa hình ảnh AI không được tiết lộ vào một bộ phim tài liệu tội phạm có thật mới. Phản ứng dữ dội đã làm dấy lên những cuộc trò chuyện quan trọng xung quanh việc thao túng truyền thông. Thích nó, sợ nó hay ghét nó, AI hiện là một phần trong cuộc sống hàng ngày của chúng ta. Từ giáo dục đến giải trí, trí tuệ nhân tạo được thiết lập để tiếp tục phát triển, định hình gần như mọi khía cạnh trong sự tương tác của chúng ta với giới truyền thông. Nhưng những thay đổi này đòi hỏi phải có ranh giới. Cả hai AI...

By Flo Bellinger Brighton, Vương quốc Anh

'Mắt sinh học' giải đáp bí ẩn về nơi an nghỉ cuối cùng của Plato

Tín dụng: Thred

phong cách sôi nổi

'Mắt sinh học' giải đáp bí ẩn về nơi an nghỉ cuối cùng của Plato

Nhà nghiên cứu người Ý, Graziano Ranocchia, cuối cùng có thể đã giải đáp được bí ẩn về nơi an nghỉ cuối cùng của Plato. Một 'con mắt sinh học' được hỗ trợ bởi AI đã quét một cuộn giấy carbon hóa 2,000 năm tuổi được viết vào khoảng năm 348 trước Công nguyên để xác định chính xác một địa điểm cụ thể ở Athens. Bí ẩn về nơi yên nghỉ của một trong những nhà triết học vĩ đại nhất thế giới có thể vừa được giải đáp – trớ trêu thay lại bằng một cỗ máy. Việc chôn cất Plato, được cho là tôn kính nhất trong số các nhà tư tưởng nền tảng của triết học Hy Lạp...

By Jamie Watts London, Vương quốc Anh

Thiên nhiên đã chính thức trở thành nhạc sĩ

Tín dụng: Pexels

Phương tiện truyền thông

Thiên nhiên đã chính thức trở thành nhạc sĩ

Là một phần của chiến dịch mới, Nature đã được công nhận là nghệ sĩ trên các nền tảng phát trực tuyến lớn, bao gồm cả Spotify. Tiền bản quyền sẽ hướng tới việc hỗ trợ các sáng kiến hành động về khí hậu trên toàn cầu. Nhiệt độ đang tăng lên, môi trường sống đang bị thu hẹp và các sông băng đang tan chảy với tốc độ chưa từng thấy. Khi khí hậu thay đổi, nỗi đau khổ của Trái đất tiếp tục đạt đến những tầm cao mới và thực tế là chúng ta sắp hết thời gian để làm điều gì đó để giải quyết vấn đề này trở thành...

By Sofia Phillips London, Vương quốc Anh

Lumiere của Google tạo video AI thực tế từ lời nhắc văn bản

Video AI đang nhanh chóng chuyển từ thung lũng kỳ lạ sang thực tế thực sự và Lumiere của Google là trình tạo chuyển văn bản thành video phức tạp nhất mà chúng tôi từng thấy cho đến nay.

'AMIE' của Google mở đường cho y học điều khiển bằng AI

Nhân viên của Google gọi Bard là 'tệ hơn cả vô dụng'

'Mắt sinh học' giải đáp bí ẩn về nơi an nghỉ cuối cùng của Plato

Thêm từ thred.

'Mắt sinh học' giải đáp bí ẩn về nơi an nghỉ cuối cùng của Plato

Video AI đang nhanh chóng chuyển từ thung lũng kỳ lạ sang thực tế thực sự và Lumiere của Google là trình tạo chuyển văn bản thành video phức tạp nhất mà chúng tôi từng thấy cho đến nay.

Các bài liên quan

'AMIE' của Google mở đường cho y học điều khiển bằng AI

Nhân viên của Google gọi Bard là 'tệ hơn cả vô dụng'

Phổ biến

'Lý thuyết Internet chết' là gì và nó có thật không?

'Mắt sinh học' giải đáp bí ẩn về nơi an nghỉ cuối cùng của Plato

Thiên nhiên đã chính thức trở thành nhạc sĩ

Cập nhật thông tin bằng cách đăng ký nhận bản tin tích cực về hành tinh của chúng tôi!

Thêm từ thred.

Giải thích sự gia tăng của du lịch ngủ

Việc sử dụng AI không được tiết lộ của Netflix gây ra cuộc tranh luận về thao túng truyền thông

'Mắt sinh học' giải đáp bí ẩn về nơi an nghỉ cuối cùng của Plato

Thiên nhiên đã chính thức trở thành nhạc sĩ