说明:翻译本文并不代表译者同意或者赞同文中观点。
很明显,Google不断地在搜集每个人的信息,却拒绝告诉我们为什么这样干。这对我们来说早就不是什么新鲜事了。在Google不能控制搜索结果页是什么样子的时候,他们却能控制谁在什么时候看什么内容。
Google are clearly gathering information about us but refuse to tell us why. It’s nothing new to us, but while they cannot control normal SERPs, they do however control who is viewing what and when.
我们在页面上运行Google广告是为了生存。但这就意味着我们不应该把下面的信息与你分享吗?如果你知道别的方法可以给我们网站支持,请和我联系。
We run Google adverts in order to survive. Does this mean we shouldn’t share the information below? If you know an alternative way to sustain costs please get in touch.
如果你察看包含Google Adsense的网页,Google就会追踪你的隐私。但请注意,Google追踪你隐私的办法不止于此。
Please note, Google does not track you by simply viewing pages containing their adverts.
1,不死的cookie:
1. Google’s immortal cookie:
在各家搜索引擎中,Google第一个使用到2038年才过期的cookie。那个时候网站还被禁止使用永久有效的cookie。现在,各家搜索引擎服务提供商都使用永久有效的cookie。因为没有人对这一点有异议,因此Google的行为为整个行业设定了标准。Google的cookie在你的硬盘上放置一个唯一的标识数。不管什么时候,只要你打开Google的网页,如果你的硬盘上没有Google的cookie,Google就会给你放一个。如果你有了,Google就会读取你的标识数并做记录。
Google was the first search engine to use a cookie that expires in 2038. This was at a time when federal websites were prohibited from using persistent cookies altogether. Now it’s years later, and immortal cookies are commonplace among search engines ; Google set the standard because no one bothered to challenge them. This cookie places a unique ID number on your hard disk. Anytime you land on a Google page, you get a Google cookie if you don’t already have one. If you have one, they read and record your unique ID number.
2,Google记录一切他们能记录的东西
2. Google records everything they can:
你每做一次搜索,Google就会记录cookie的标识数和递交搜索的IP地址,时间日期,搜索关键词和浏览器配置。Google越来越可能提供基于你IP地址优化的搜索结果,因为IP地址分配和物理位置是有关系的。
For all searches they record the cookie ID, your Internet IP address, the time and date, your search terms, and your browser configuration. Increasingly, Google is customizing results based on your IP number. This is referred to in the industry as “IP delivery based on geolocation.”
3,Google永久保存他们记录的数据
3. Google retains all data indefinitely:
Google内部没有数据保留多久的规定。有证据表明Google能够很方便地接触到搜集和保存的全部用户信息。
Google has no data retention policies. There is evidence that they are able to easily access all the user information they collect and save.
4,Google不解释为什么他们需要这些数据
4. Google won’t say why they need this data:
向Google发出隐私政策的查询总是得不到回应。当纽约时报询问Sergey Brin(Google创始人之一和总裁)Google有没有因为隐私政策信息而受到法庭传唤时,他不予置评(2002-11-28)。
Inquiries to Google about their privacy policies are ignored. When the New York Times asked Sergey Brin about whether Google ever gets subpoenaed for this information, he had no comment.
5,Google雇佣间谍
5. Google hires spooks:
Matt Cutts,一位重要的工程师,曾经为National Security Agency(译者按:我不清楚这个组织是干什么的)工作。Google希望能够雇佣更多的人来对搜集到的数据进行调查,这样他们就能向华盛顿的间谍们组织叫卖值钱的信息。
Matt Cutts, a key Google engineer, used to work for the . Google wants to hire more people with security clearances, so that they can peddle their corporate assets to the spooks in Washington.
6,Google 工具栏是间谍软件
6. Google’s toolbar is spyware:
如果你允许使用高级选项,那么你看的每一个网页都会被工具栏记录并且传送到Google服务器。安装工具栏时候的隐私策略已经承认了这一点,不过那仅仅是因为可能的起诉。Alexa的工具栏干了同样的事情却没有在隐私策略中声明,从而输掉了一桩官司。更糟的是,Google工具栏不会在升级之前询问你的意见,它总是静悄悄的就完成了升级。这意味着,一旦你安装了Google工具栏,每一次你连接到Google网页(一天里有很多次吧),Google就对你的硬盘有完全的访问权限。大多数软件供应商,甚至微软都会询问你是否需要升级。Google不是这样。任何自动升级的软件意味着大量潜在的安全隐患。
With the advanced features enabled, Google’s free toolbar for Explorer phones home with every page you surf, and yes, it reads your cookie too. Their privacy policy confesses this, but that’s only because Alexa lost a class-action lawsuit when their toolbar did the same thing, and their privacy policy failed to explain this. Worse yet, Google’s toolbar updates to new versions quietly, and without asking. This means that if you have the toolbar installed, Google essentially has complete access to your hard disk every time you connect to Google (which is many times a day). Most software vendors, and even Microsoft, ask if you’d like an updated version. But not Google. Any software that updates automatically presents a massive security risk.
(译者按:Google Desktop呢?)
7,Google的网页快照是非法的
7. Google’s cache copy is illegal:
依据第九巡回法庭将美国版权法应用于互联网的判例判断,Google的网页快照似乎不合法。唯一避免网站被Google保存快照的办法就是在每一个页面里面加上noarchive元标记。浏览者喜欢网页快照,但是网站管理员们不喜欢。很多网站站长已经删除了网站上有问题的内容,却发现这些内容依然存活于网页快照。网页快照应该是可以选择加入或不加入,而不是现在这样,只能选择退出或不退出。
Judging from Ninth Circuit precedent on the application of U.S. copyright laws to the Internet, Google’s cache copy appears to be illegal. The only way a webmaster can avoid having his site cached on Google is to put a “noarchive” meta in the header of every page on his site. Surfers like the cache, but webmasters don’t. Many webmasters have deleted questionable material from their sites, only to discover later that the problem pages live merrily on in Google’s cache. The cache copy should be “opt-in” for webmasters, not “opt-out.”
8,Google不是你的朋友
8. Google is not your friend:
到目前为止,绝大多数网站访问量的75%都来自于Google。如果网站站长要增加流量,他们得先问问Google同不同意。如果站长们想利用Google半保密半公开的算法中的某些漏洞来得利,他们很快就会被Google惩罚,流量完全没有了。Google没有发布详细公开的惩治流程。对被处罚的网站来说,也找不到任何上诉的途径。Google的行为根本是无法预计的。大多时候Google甚至都不回复网站站长的信件。
By now Google enjoys a 75 percent monopoly for all external referrals to most websites. Webmasters cannot avoid seeking Google’s approval these days, assuming they want to increase traffic to their site. If they try to take advantage of some of the known weaknesses in Google’s semi-secret algorit
hms, they may find themselves penalized by Google, and their traffic disappears. There are no detailed, published standards issued by Google, and there is no appeal process for penalized sites. Google is completely unaccountable. Most of the time Google doesn’t even answer email from webmasters.
9,Google是隐私定时炸弹
9. Google is a privacy time bomb:
Google每天承担2亿次的搜索,其中大多数来自美国以外。由此可见,Google已经积累了足可以引发一场隐私灾难的数据。华盛顿那些新上任的负责数据挖掘的官僚做梦都想的高效率早就被Google实现了。
With 200 million searches per day, most from outside the U.S., Google amounts to a privacy disaster waiting to happen. Those newly-commissioned data-mining bureaucrats in Washington can only dream about the sort of slick efficiency that Google has already achieved.
译者按:起初看了觉得挺有意思。但在翻译的过程觉得作者比较偏激,缺乏引证。
再次说明:翻译本文并不代表译者同意或者赞同文中观点。
分类 : 技术文摘 | 发表时间 11-10-2005
定义Web2.0是困难的,所以就产生了很多混乱。有人从“Web”的角度质疑,有人从“2.0”的角度争论。最终这个问题变得像“什么是blog”一样,鸡一嘴鸭一嘴,公说公有理,婆说婆有理,越争越乱。所以Chris Anderson说,blog圈子的第一原则就是不要去概括blog圈子。他认为,Web 2.0缺乏清晰的定义正好是它的一个特性,而不是一个bug。
Tim O’Reilly仍然试图解释,什么是Web 2.0。不过他换了一种方式,用例子来解释,而不是用定义,并通过具体的例子,引申出某些Web 2.0原则。关键问题在于,Web 2.0不是一种技术升级,而是一种观念升级。下面是Tim绘制的一张图,就像太阳系一样,Web 2.0有着核心的原则,也有一些离核心或远或近的具体实践。
在Tim看来,Web 2.0最核心的观念就是,“Web作为平台”。我想,其意义大概就像1980年代操作系统作为平台一样。与操作系统平台不同的是,任何人不拥有这个平台,Web平台是通过分享或参与体系搭建起来的,是对“集体智慧”的充分理解和利用,而不再是大企业的资源垄断。
Web 1.0 –>Web 2.0
DoubleClick–>Google AdSense
Ofoto–>Flickr
Akamai–>BitTorrent
mp3.com–>Napster
不列颠百科全书在线–>Wikipedia
个人网站–>blogging
evite–>upcoming.org and EVDB
域名投机–>搜索引擎优化
页面浏览量–>每点击成本
screen scraping–>web services
出版–>参与
内容管理系统(CMS)–>wikis
目录(分类法)–>tagging (“民间分类”)
粘性–>内容聚合
Tim分别对Web 1.0和Web 2.0时代的代表性企业进行了对比,如Netscape和Google、DoubleClick和Overture与AdSense、Akamai和BitTorrent等。他总结的Web 2.0的七大特性包括:Web作为平台、借力集体智慧、数据成为下一个Intel Inside、软件发行周期的终结、轻量级编程模式、超越单一设备层次的软件、富用户体验。他进而提出了八项Web 2.0设计范式:长尾、数据成为下一个Intel Inside、用户增添价值、网络作用作为默认值、保留部分权利、永远的beta、合作而不是控制、软件超越单一设备层次。
如果说互联网是通过大幅度降低信息获取的门槛,发掘出传统经济中被忽视的价值的话,那么Web 2.0则是借助用户参与体系,将上一代网络公司忽视的长尾的价值发掘出来。Tim说,借助消费者自服务和基于算法的数据管理,服务延伸至整个web——抵达边缘而不仅仅是中心,抵达长尾而不仅仅是头部。
Tangos也列出了他所理解的Web 2.0的四个核心特性:可重用的微内容、以用户(人)为中心,而不是以物为中心、社会性、用户参与的架构。实际上后三个特性应该算是一个特性,即开放的参与架构。归根结底,这是一种观念。观念的改变,有时候要远远难于技术的升级。
Undersound认为:“其实Web2.0在某种程度上不依赖于技术,而是一种态度:用户体验,资源共享,集体思维,平台开放。这些不是你做不到,而是你没有想到而已。”其实不完全如此,因为Web 2.0对用户、对整个互联网产业是好消息,但对某些互联网公司,却是坏消息。比如不列颠百科全书在线就一定不喜欢Wikipedia,收费的在线广告也一定不喜欢免费的Craigslist。O’Reilly Media的编辑Nathan Torkington就说过,Web 2.0在某种程度上很像日本的合气道,即用对手的力量战胜他们。因此,对有些人来说,Web 2.0确实是个坏消息。
Web 2.0的原则之一就是,与其相信自己的所谓优势,不如相信你的用户。本质上,这也是自由软件运动的原则之一。我常常觉得,Web 2.0的实践者们一定是从自由软件运动中得到了某种启示和灵感。相信集体智慧,相信开放的开发模式,相信参与者越多质量越好等等,这些Web 2.0的原则,恰好也都是自由软件所崇尚的。因此我想,Web 2.0如果也算是一股潮流的话,那么它应该是自由Web潮流,或者叫Web的开放源代码。微软无法接受自由软件,是因为Windows、Office至今仍是它的核心竞争力和命脉所在。
因此可以说,Web 2.0是互联网原有商业规则的破坏者。贴着Web 2.0的标签,干着Web 1.0的事儿,这是投机。商业可以投机,但观念无法投机。看看他是想垄断还是想开放,想控制还是想合作,一切就一清二白了。
Tim列出了七条他认为的Web 2.0公司的核心能力:
有着可测量成本效益的服务,而非软件包(Services, not packaged software, with cost-effective scalability);
控制独有的、难以再造的数据源,这些数据源使用的人越多就越丰富(Control over unique, hard-to-recreate data sources that get richer as more people use them);
把用户当成合作开发者一般信任(Trusting users as co-developers);
借力于集体智慧(Harnessing collective intelligence);
从消费者自服务中产生长尾优势(Leveraging the long tail through customer self-service);
超越单一设备层次的软件(Software above the level of a single device);
轻量级的用户界面、开发模式和商业模式(Lightweight user interfaces, development models, AND business models)。
