返回首页
搜狗 >> 视频搜索

互联网视频开放协议概述

《互联网视频开放协议》是搜狗影视制定的视频搜索引擎视频来源收录标准,网站可以将您发布的视频内容制作成遵照此开放协议的XML格式的网页(独立于网站原有的视频发布形式),供搜狗搜索引擎索引,将网站发布的视频及时的告知搜狗搜索引擎。


采用《互联网视频开放协议》,将会为您的网站带去更多的流量!网民将在更大范围内访问到您网站中的视频,进而为您的网站带来潜在的流量。


您可以在我们的帮助下轻松使用该协议!


开放协议内容

遵循此开放协议的XML格式的网页,如下图所示,在网页中按照标准格式列出您的网站发布的视频的相关信息。

下图为遵照《互联网视频开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的视频的相关信息。

XML网页示例:

截图

XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。
*<updatePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的视频更及时地出现在搜狗影视中。协议中只是一个参考值,搜狗影视会参考这个值定期地检查您所提供的xml文件是否改变,检查改变的方法是通过发送HEAD请求检查xml文件的Last-Modified或Content-Length是否改变,来决定是否进行抓取。所以请务必确认您的服务器能返回Last-Modified或Content-Length其中一项,并且其值会根据您的xml文件的改变而改变。
*<item>——标记每个视频信息的开始和结束。标记内为单个视频信息,不包括视频专题。
*<op>——标记视频信息的操作类型,为add表示添加,为del表示删除。
*<title>——视频标题(当op为del时也可不提供)。
*<playLink>——视频播放所在页面url地址。
<index>——视频的序号(也可不提供,搜索引擎会忽略该标签)。
<imageLink>——视频缩略图的url地址。视频图片为448x252或以上的横版大图(比例16:9)否则不予收录。
<author>——视频作者。
<videoLink>——视频内容的url地址。
<category>——视频类别信息,对视频内容的大概分组,一般只有一个,支持多个。
<hd>——如该条数据为高清数据,请添加标签,后面标示为1。如非高清数据,则不要添加此标签或置成0。高清标签需要放在每条数据的所属字段中,并请严格保证添加该字段的数据确实达到贵站判定的高清标准,该字段对结果排序影响较大,我们会定期审核,发现违规的xml接口一律下线。
<copyright>——如该条数据具有版权,请添加标签,后面标示为1。如非版权数据,则不要添加此标签或置成0。正版标签需要放在每条数据的所属字段中,并请严格保证添加该字段的数据确实为贵站的版权数据,该字段对结果排序影响较大,我们会定期审核,发现违规的xml接口一律下线。
<live>——如果该条数据是直播数据,请添加< live >标签,后面标示为1。如非直播数据,则不要添加此标签或置成0。直播标签需要放在每条数据的所属字段中,并请严格保证添加该字段的数据确实为贵站的直播数据,该字段对结果排序影响较大,我们会定期审核,发现违规的xml接口一律下线。直播数据一般是播放页地址不变如http://s.sohu.com/live1/,贵站在该直播页直播的内容发生变化时,把该条数据的title、tag、comment、duration、pubDate等和目前正在直播的内容的相关数据修改后重新提交该数据,搜狗会对数据重建索引,该直播能容能够在线上被搜索到。对于直播数据,希望xml接口的内容更新频率能快些,以保证直播的数据能够及时被检索到。
<mPlayLink>——移动端视频播放所在页面url。此字段的url将在wap端展现,不填则此条数据,在移动端不展现。字段支持可选属性support,support的值目前有三种选项all/android/ios,分别代表所有移动端可播/Android可播/IOS可播;若无此属性,默认“所有移动端可播”;support不同的情况下,可提交多个mPlayLink字段。备注:playLink标签意义不变,为必填项,表示PC端展现地址,勿填错!若存在只有移动端可播,PC端不可播的情况,请联系本站产品!
<swfurl>——视频的flash资源地址。
<downloadLink>——下载视频所用的url,可能和videoLink一致。
<format>——视频格式(如:mp4,m3u8等)。
<bitrate>——视频码率,单位kps。
<resolution>——视频分辨率(如:352*288)。
<tag>——视频分类信息。
<comment>——视频注释信息。
<duration>——视频播放时间。以秒为单位。
<pubDate>——视频发布时间,与该视频播放页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。

推荐时间格式:年月日小时分钟秒
如:2005-11-09 10:37:34

开放协议的使用

使用协议之前,您需要了解以下几点:

1. 无论您的网站是否已经成为搜狗的视频源,都可以使用此开放协议。
2. 您使用开放协议所提供的内容应该全部符合下面的《视频源收录标准》。
3. 《互联网视频开放协议》只是原始视频源收录方式的一种有益补充,而不是完全取代。

视频源收录标准:

搜狗希望视频源多样化,鼓励原创视频内容。搜狗收录视频源的基本原则是具有大量有价值的视频内容并能够及时更新的正规、合法的网站,且网站服务器稳定、高速。

搜狗影视收录任何类型的视频,不过您应对所提供的全部内容承担一切法律责任,保证您所提供内容的真实性、合法性,并且不得侵犯任何第三方的权益。

XML文件的最小更新周期为5分钟,小于5分钟,搜狗影视将不能保证能及时获取您更新的数据。

XML文件的大小最大为10M,大于10M的文件搜狗影视将不能保证正确获取。

XML文件提供的视频数据请保证至多是最近7天内的数据,对于7天前的数据搜狗影视将不予抓取。如果您的站点想提供7天前的数据,请联系我们,同时提供另一个临时URL地址,让搜狗影视访问索取,这个临时地址的XML文件不可超过2G。如果文件较大,建议分为多个文件,提供多个URL地址。

具体步骤:
第一步:创建XML文件

请按照上面公布的开放协议内容制作XML文件。

其它说明:

·支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB18030和UTF-8。注意:XML文件头部的encoding值必须与XML文件的实际编码类型一致。
·您可以将网站某一时间段发布的全部视频放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。
·网站审批未通过的视频,或者用户设为私有的视频,不建议进行提交。如果已经提交,建议通过DEL标记进行删除。
·请保持每个XML文件处于按更新周期持续自动更新状态。
·XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的视频,
具体参见下表。如不想转义,则必须使用CDATA标记内容,如"XML网页示例"所示。
字符 转义后的字符
HTML字符 字符编码
和(and) & &amp; &#38;
单引号 ' &apos; &#39;
双引号 " &quot; &#34;
大于号 &gt; &#62;
小于号 &lt; &#60;

第二步:验证XML文件

可以采用xmlspy或firefox对XML文件进行验证。更多验证工具,可参见下面地址:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的视频信息不被搜狗搜索引擎遗漏。

第三步:提交XML网址

提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。搜狗影视将对您提交的数据进行测试和观察一段时间,若您基本按照 《互联网视频开放协议》的要求进行制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。

注意: 搜狗影视不保证一定能收录您提交的全部内容。


*站点名、地址为必填项。
站点名           站点地址
 
接口地址

联系人邮箱

联系人msn

联系人QQ


备注

有需要时填写,并将内容控制在200字以内。


如有疑问,请联系我们
企业推广 - 拼音输入法 - G邮箱 - 搜狗大全