FunClip:阿里巴巴开源的自动化视频剪辑工具(图1)

FunClip:阿里巴巴开源的一款视频自动化视频剪辑工具 专门用于精准、便捷的视频切片。 

FunClip能够自动准确识别视频中的语音,基于识别结果的文字选段随心裁剪视频片段。并允许用户根据语音内容来裁剪视频。 你可以根据识别结果选择文本片段或说话人进行视频裁剪。 FunClip不仅支持中文,未来还将支持英文视频剪辑。

FunClip基于阿里巴巴通义实验室自研SeACo-Paraformer-长音频版的语音识别、端点检测、标点预测、时间戳功能、角色区分、热词定制化功能,能准确识别,自由复制所需段落,或者设置说话人标识,一键裁剪、添加字幕。

FunClip特点和功能:

完全开源和本地部署:用户可以自由地在本地环境中部署和使用FunClip,无需担心数据隐私问题。

自动化语音识别:FunClip利用阿里巴巴通义实验室的FunASR Paraformer系列模型,能够将视频中的语音内容转换为文字,实现高效的视频剪辑体验。

热词定制化:用户可以指定一些实体词、人名等作为热词,以提升特定词汇的识别准确率。

说话人识别:FunClip集成了CAM++说话人识别模型,允许用户根据自动识别的说话人ID裁剪出特定说话人的视频段落。

视频裁剪:用户可以根据识别结果中的文本片段或指定说话人,通过点击裁剪按钮获取对应视频片段。

Gradio交互界面:通过Gradio实现的交互界面,简化了视频剪辑的操作流程,用户可以在服务端搭建服务并通过浏览器进行剪辑。

多段剪辑支持:FunClip支持用户对视频进行多段剪辑,提供了灵活的编辑能力。

自动生成字幕:剪辑后的视频可以自动生成全视频和目标段落的SRT字幕文件,方便用户添加或编辑字幕。

命令行调用:除了图形界面,FunClip还支持通过命令行进行视频识别和裁剪,提供了更灵活的使用方式。

如何使用FunClip:

方法一:本地部署Gradio版本。首先确定电脑上已安装Python和Git,然后打开终端依次输入并运行以下命令:

FunClip:阿里巴巴开源的自动化视频剪辑工具(图2)

方法二:在线体验魔搭社区Demo。访问魔搭社区提供的在线Demo,然后按照下方的步骤操作:

  • Step1:上传视频或音频文件(或使用下方的用例体验),点击 识别 按钮

  • Step2:复制识别结果中所需的文字至右上方,或者右设置说话人标识,设置偏移与字幕配置(可选)

  • Step3:点击裁剪按钮或裁剪并添加字幕按钮获得结果。

受到网络传输与服务资源的限制,用于体验的视频最好大小在40mb以下 过大的视频可以尝试分离音轨使用音频剪辑,或 通过源代码将您的ClipVideo服务部署在本地(推荐) 

方法三:命令行运行相关指令。打开终端依次输入并运行以下命令:

FunClip:阿里巴巴开源的自动化视频剪辑工具(图3)

FunClip的官方GitHub源码地址为:https://github.com/alibaba-damo-academy/FunClip

FunClip试用地址:

https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary