-->
为五月的纽约流媒体保留座位吧. Register Now!

导论:基于ai的编解码器开发的基础

虽然许多公司利用人工智能来提高现有编解码器(如H.264, HEVC, and AV1, UK-based Deep Render is developing a fully AI-based codec. 为了促进对AI编解码器开发的理解,Deep Render的首席技术官兼联合创始人, Arsalan Zafar,推出了一个名为“基于人工智能的编解码器开发基础:入门课程.在最近接受《百家乐app下载》采访时, Zafar提供了对课程内容的见解, target audience, and expected outcomes.

Zafar首先解释了Deep Render的使命是“利用机器学习开拓下一代图像和视频编解码器.然后他分享说,自成立以来的五年里,深度渲染开发了 world's first AI codec,他声称这比H.264.

Why did Zafar produce this course? 用他的话来说,“你有没有想过基于人工智能的编解码器是如何工作的?“深度渲染一直沉浸在这一追求中, Zafar想要为更广泛的编解码器社区揭开它的神秘面纱. To accomplish this, 本课程探讨人工智能和机器学习的历史演变, 强调关键的里程碑和最近的进展.

本课程从机器学习架构的基本原理开始, loss function, 以及训练——这对于理解基于人工智能的编解码器的基本概念至关重要. 然后探讨了基于人工智能的编解码器的架构, 演示如何配置神经网络层和机器学习原语以优化压缩效率. Formulating the objective function, 哪一个定义了汇率扭曲的权衡, 是基于人工智能的压缩的一个关键方面. Zafar还解释了如何以可微分的方式定义速率和失真, 通过反向传播实现高效优化.

ai-based codecs course objectives

然后,Zafar引导学习者完成编码和解码过程, 强调从传统方法到机器学习驱动方法的转变. 这种实用的学习方法确保学习者能够将从课程中获得的知识应用到现实世界中.

该课程后来提供了基于人工智能的编解码器的生产方面的概述, 详细介绍了从训练到推理的过渡,以及有效执行的神经处理单元的使用. 然后探讨了基于人工智能的编解码器的特点和优势, 比如对特定领域内容的适应性,以及硬件进步带来的可伸缩性. Zafar强调了基于人工智能的编解码器生态系统快速创新和更新的潜力, 促进更快的推出和适应不断变化的行业需求.

In addition to theoretical discussions, 该课程提供了基于人工智能的压缩的实际演示和示例, 展示成功的成果和潜在的挑战. Arsalan邀请学习者参与深度渲染的演示和百家乐软件,以进一步探索基于人工智能的编解码器的功能.

这门课程是为高技术水平的听众设计的, 主要是视频编解码器工程师,他们希望将基于人工智能的编解码器集成到他们的管道中, 尽管它对其他只想探索人工智能在视频编解码器开发中的应用的技术人员也很有用. Zafar将其描述为基于人工智能的压缩入门, 探索详细的算法,同时解决现实世界的生产考虑因素,如发行所需的播放平台. Despite its concise duration of 16 minutes, 本课程提供了人工智能视频编解码器开发的全面概述, 使其成为任何对该领域感兴趣的人的宝贵百家乐软件.

这个免费的百家乐软件可以在YouTube上找到 http://bit.ly/AI_codec_course.

Streaming Covers
Free
for qualified subscribers
Subscribe Now Current Issue Past Issues
Related Articles

’Round the Horn at NAB 2024: Videon, Telestream, Phenix, Ateme, V-Nova, Twelve Labs, Norsk, Dolby, and NETINT

任何NAB报告都像是盲人和大象的故事:你所经历的就是你所触摸的, 代表整体的一小部分,甚至可能不是一个好的样本. 话虽如此,这是我在节目中触摸到的东西. 其中许多经历都伴随着我拍摄的采访视频.

iSize声称其首次亮相的AI编解码器节省了大量性能

BitSave承诺通过机器学习节省70%的比特率,目前与H.264, with H.264, H.265, and VP9 on the way