生活

<p>向结构化数据标记的移动(即,增加使用Open Graph,Schemaorg,RDFa等标准)已经困扰了我一段时间,但我无法完全理解问题几周前在SMX East,有关于这些主题的一些精彩演讲,我终于意识到我对这些标准的扩散和使用有很多重要的保留,在很多层面上(主要是从出版商的角度来看;对于最终用户来说,它们通常是一个非常积极的发展)</p><p>虽然很复杂,但是以外行人的话来说,我会说:将它们视为与页面上的其他元标记类似,类似于元描述或元关键字,但通常采用XML格式,这些格式传达了关于各种元素的某些结构化信息对象与元标记一样,它们是机器可读的,但不一定能在浏览器中呈现给人类</p><p>搜索引擎结果中显示的大量丰富信息(如评论,价格等)正在通过使用这些标准公开其数据的发布者(即网站所有者)图1显示了Google在搜索结果中显示的一些结构化数据如果您想学习,则已搜索[schemaorg],[微格式]或[开放图表]更多图1 - 搜索结果中显示的结构化标记示例通过在搜索结果中显示丰富的信息,Google和其他人可以让用户更快地导航到他们需要的信息另一种思考方式是,他们基本上拒绝发布者如果他们导航到网站然后不得不四处寻找,用户会给他们的导航点击次数例如,在SERP中显示电影放映时间会让发布者有机会尝试让观众购买一张提取的票据</p><p>票房;用户可以看到播出时间,然后继续他们的下一个任务,只需在剧院购买门票是的,这似乎是共识,虽然不清楚为什么可能是搜索引擎故意偏爱暴露信息的页面以这种方式(似乎很可能),或者它也可能是(作为SMX东部谈话中的观众中的某人),这些模式的使用可能只会使出版商更好地组织和曝光他们的信息例如,如果你正在使用暴露姓名,地址和电话号码的模式标记,你不可能忘记包括你的电话号码(它作为一种清单),它可能会让你暴露HTML中的电话号码供用户查看无论哪种方式,使用结构化数据标记的发布商都会报告更高的自然流量;但想一想;显然,这必须以不使用它们并且因此流量较低的其他人为代价令我担心的是:当每个人(或至少前10个搜索结果)都使用结构化数据标记时会发生什么</p><p>在这一点上,更高流量的争论将无法实现 - 如果每个人都这样做,那就没有优势</p><p>微格式使您的信息更容易被您不想获取信息的网站所扫描和解析,而不仅仅是搜索引擎 - 刮刀,甚至是想要监控您的定价的竞争对手,等等为什么搜索引擎可以在SERP中显示我的定价信息,但是我的竞争对手在他们的网站上显示它并不合适</p><p>微格式通过自由地允许搜索引擎显示其中提供的信息,似乎处于合法的滑坡 - 如果没有这样的机制,你应该如何界定已接受的用途和未被接受的用途</p><p>熟悉来自IT世界的模式的任何人,例如SNMP,DMI,USB等,都可以证明它们的用处,但这些是为特定目的而创建的模式使用模式描述Internet上对象信息的问题是:整个世界基本上都暴露在互联网上互联网上有关于食谱,发辫,名人甚至最终的信息,左手指上的雀斑如果行业在互联网上推动构建信息,真正实现的是构建关于世界上的一切如果你不相信我,请看一下schemaorg的完整层次结构 - 它看起来像一个滑坡,看不到尽头,这种等级很可能会继续充实并随着时间的推移而扩大 是的,你读得正确根据创世纪,上帝让亚当命名所有的动物他没有告诉亚当命名,编目,编制,组织和标记花园中的每个物体到树的水平5是父母第6分支是树枝4的父母,它是叶子3的父母,具有绿色和锯齿状的属性我总是认为搜索引擎正在吸收机器学习和人工智能领域的所有博士学位</p><p>他们可以让计算机为我们解决问题例如,我认为谷歌的某个人现在已经编写了一个程序来检查一个网页,确定它是一个食谱,并解析它并找出成分,步骤和时间相反,似乎谷歌的解决方案相反,嘿,如果你只是标记并标记你的食谱中的所有信息将是很好的 - 谢谢我认为这是计算机的首要目的,计算东西出来了!计算机应该推断意义,没有人类标记意义在我看来,用于指代这些模式角色的短语Semantic Web是有史以来最大的技术用词 - 它们没有任何语义它应该被称为我们未能理解实际意义所以我们要让每个人都标记所有内容而不是网络Google最好能与所有这些博士一起做的就是告诉我们:嘿大家,请注意世界上的一切,因为这会让事情变得更加容易真</p><p>为什么你打扰雇用所有这些人,是你们能想出的最好的人</p><p>你可以说这不是浪费人力,因为你的CMS会处理这个问题虽然这有点真实,但是工程师创建CMS时要注意你的DBA或Web开发人员用来集成后端数据的特定模式</p><p>以结构化的方式使用CMS并且针对手头的特定模式,来自世界各地的人们不得不飞往巴黎,或者在任何地方,进行一些会议,并争论和讨论对象将拥有的属性,以及它将在层次结构中的位置这是人类的全部努力如果您考虑一下,通过在您的网页上公开数据以便机器阅读,您没有向人类展示它,它几乎就像隐藏真实内容 - 您呈现的不同信息给蜘蛛而不是用户当然,你应该向用户显示相同的数据,但是要有一个漂亮的可呈现HTML格式,这与隐藏真实有什么不同</p><p>事实上,随着搜索引擎在解析这些数据时变得更聪明,我确信一些聪明的人会开始制定检查 - 嘿,这个人对我们说了一件事,但说了一些与人类不同的东西然后出版商将不得不开始担心运行报告以确定网站上的哪些页面具有与页面上其他内容不匹配的架构信息更多的复杂性我们不需要为什么为什么要在页面上以不同的格式多次列出相同的数据</p><p>当你在它的时候,你为什么不在你的页面上扔一堆hreflang标签</p><p>也许你可以把它变成四到五倍,因为它需要尽可能多的垃圾;这应该是你的页面加载速度时间的好!关于HTML标准的好处是,它包括了所有足够的东西,但只包括那些必要的东西 - 为什么我们现在在所有这些不同的格式中一遍又一遍地在页面上说同样的东西</p><p>重要的是,在一个领域的重大改进与支持领域的改进相匹配例如,现在谷歌已经拥有通用搜索,如果AdWords关键字工具实际上告诉了您有关通用结果的信息,那会不会很好</p><p> (失败!)这是一个未能跟上大趋势的支持区域的一个小例子对于模式,在我看来,无法跟上的关键支持区域是robotstxt格式不知怎的,搜索引擎似乎已经得到了社会(在某些情况下,法院)认为你的“机器人文件文件相当于某种机器可读的法律协议”就个人而言,我认为这是一个荒谬的立场 - 我确信主要的搜索引擎都在不断抓取网站其条款和条件明确禁止使用程序来阅读网站 - 但搜索引擎使用robotstxt作为无花果叶,以是/否基础显示或不显示SERP中的内容 现在Microformats正在激增,我们正在被灌输,如果有什么结构,它可以在SERP中显示,什么是阻止搜索引擎在SERP中显示以这种方式标记的任何内容</p><p>为什么不将所有内容标记为第1段,第2段和第3段,只是给它们全部内容</p><p>在我看来,机器人文本格式需要不断发展,因此发布商可以指定如何使用他们的信息,而不仅仅是他们的信息是否可以使用理想情况下,robotstxt应该是一个生活在每个页面上的碎片,每个微小的内容应该能够指定出版商使用它的意图还记得SGML吗</p><p>你们大多数人都没有SGML(可能仍然是,我不知道)是一种结构化的标记语言,它被用于各种目的,但是当我在90年代早期遇到它时,它似乎主要是由技术写作社区,为了使手册和规格表机器可读,我当时在半导体行业,SGML同时风靡技术写作社区以及它的祸根 - 因为它是一个巨大的,臃肿的标准似乎是由一些失控的委员会设计的,这些委员会已经超越了顶级幸运的是,HTML,它是SGML的一个小侄子,使用了SGML的一些惯例,但是被创建了作为描述更简单的超文本文档的更简化的标记语言然后,当Tim Berners-Lee在CERN构思互联网时,你真正需要的只是标题标签,一些内容,一些大胆和段落标签,以及 - 繁荣 - 你可以有一个 网页这个Schema的内容是回归SGML方法 - 委员会管理,庞大的分层类/财产标准,以及将变得不必要复杂的互联网这些标准中的一些,以及关于它们采用的决定,是实际上将涉及公司的生死决定如果您不相信我,请回到过去并询问FTP软件,这是一个流行的Microsoft Windows TCP / IP堆栈的提供商,他们认为当微软决定包括Windows中自己的TCP / IP堆栈!如果您是旅游提供商,您应该担心搜索引擎会越来越多地在搜索结果页面上提供旅行搜索信息 - 因此您可能应该担心旅行信息领域正在处理的任何模式如何保险提供商</p><p>房地产</p><p>信用报告</p><p>如果您不希望被大型搜索引擎取消中介,您可能希望参与标准流程......而不是总是让它成功这是标准世界的一个肮脏的小秘密,您将无法阅读关于新闻文章,但许多标准委员会成员通常实际上对其公司负有信托责任,以确保任何已批准的标准是失败的,或者遗漏关键数据,以便他们的公司仍然可以继续主导其市场空间不相信我</p><p>参与一个涉及主导市场参与者的标准委员会,并观察他们的行为!其中一位小组成员提到了这一点:一旦整个世界被分类和标记,制作一个新的搜索引擎会容易得多,因为随着这些模式的激增,它将不再需要实际理解</p><p> ,可能会创建一些有趣的初创公司,以有趣的方式利用这些数据;十年后,我们无疑会惊讶于另外两三个大型玩家在这个大趋势中如雨后春笋般涌现</p><p>简而言之:在我看来,从发行商的角度来看,这些新兴的结构化数据标记标准允许搜索引擎,竞争对手和刮刀更容易窃取你的内容;可能从长远来看否认你点击,导致不必要的页面膨胀,不必要地复杂化;并且在制造人类结构数据而不是让计算机推断结构方面使行业重新回到了二十五年但是,看起来它们对最终用户来说非常好并且是不可避免的,所以你最好加入这个潮流!本文中表达的观点是客座作者的观点,