《互联网视频开放协议》是搜搜视频搜索制定的视频搜索引擎视频来源收录标准。网站可以将发布的视频内容制作成遵照此开放协议的XML格式的网页(独立于网站原有的视频发布形式),供搜搜视频搜索引擎索引,将网站发布的视频主动、及时地告知搜搜搜索引擎。
按照我们的指引方式您可以轻松使用该协议!
遵循此开放协议的XML格式的网页,如下图所示,在网页中按照标准格式列出网站发布的视频的相关信息。
XML网页示例:

XML标签说明:其中带星号标记的为必选项,未带星号标记为可选项
*<document>——整个XML文件内容的标记。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。
*<updatePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的视频更及时地出现在搜搜视频中。协议中只是一个参考值,搜搜视频搜索会参考这个值定期地检查您所提供的xml文件是否改变,检查改变的方法是通过发送HEAD请求检查xml文件的Last-Modified或Content-Length是否改变,来决定是否进行抓取。所以请务必确认您的服务器能返回Last-Modified或Content-Length其中一项,并且其值会根据您的xml文件的改变而改变。
*<item>——每个视频的信息。
*<op>——视频信息的操作类型,为add表示添加,为del表示删除。
*<title>——视频标题(当op为del时也可不提供)。
*<playLink>——视频播放所在页面url地址。
<imageLink>——视频缩略图的url地址。
<videoLink>——视频内容的url地址。
<tag>——视频分类信息。
<comment>——视频注释信息。
<duration>——视频播放时间。以秒为单位。
<pubDate>——视频发布时间,与该视频播放页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。推荐时间格式:年月日小时分钟秒,如:2008-12-21 19:07:00
<author>——视频作者。
使用协议之前,您需要了解以下几点:
1. 无论您的网站是否已经成为搜搜的视频源,都可以使用此开放协议。
2. 您使用开放协议所提供的内容应该全部符合下面的《视频源收录标准》。
3. 《互联网视频开放协议》只是原始视频源收录方式的一种有益补充,而不是完全取代。
视频源收录标准:
·搜搜希望视频源多样化,鼓励原创视频内容。搜搜收录视频源的基本原则是具有大量有价值的视频内容并能够及时更新的正规、合法的网站,且网站服务器稳定、高速。
·搜搜视频搜索收录任何类型的视频,不过您应对所提供的全部内容承担一切法律责任,保证您所提供内容的真实性、合法性,并且不得侵犯任何第三方的权益。
·XML文件的最小更新周期为5分钟,小于5分钟,搜搜视频搜索将不能保证能及时获取您更新的数据。
·XML文件的大小最大为10M,大于10M的文件搜搜视频搜索将不能保证正确获取。
·XML文件提供的视频数据请保证至多是最近7天内的数据,对于7天前的数据搜搜视频搜索将不予抓取。如果您的站点想提供7天前的数据,请联系我们。
具体步骤:
第一步:创建XML文件
请按照上面公布的开放协议内容制作XML文件。
其它说明:
·支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB18030和UTF-8。注意:XML文件头部的encoding值必须与XML文件的实际编码类型一致。
·您可以将网站某一时间段发布的全部视频放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。
·请保持每个XML文件处于按更新周期持续自动更新状态。
·未在上述XML标签说明中出现的标签将被忽略。
·XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的视频,
具体参见下表。如不想转义,则必须使用CDATA标记内容,如"XML网页示例"所示。
| 字符 | 转义后的字符 | ||
|---|---|---|---|
| HTML字符 | 字符编码 | ||
| 和(and) | & | & | & |
| 单引号 | ' | ' | ' |
| 双引号 | " | " | " |
| 大于号 | > | > | > |
| 小于号 | < | < | < |