存档

文章标签 ‘Google’

看来写技术博客没前途

2011年4月21日 315 条评论 13,190 views

今天中午,看了下本博客sigma的百度统计,发现好诡异,很多通过google到我之前写过那篇关于《砰然心动》电影的文章的访问。有图为证:

百度统计图
个人感觉很诡异,因为之前几乎没有通过google搜索关键字“砰然心动”来到我博客的统计,今天突然暴增,很是诡异,之后我自己搜了下关键字,发现我的网页都是排名在第二页以后,这样还能有这么多流量!之后我用AdWords的keyword tools分析了关键字“砰然心动”,发现那里显示每月搜索量不到10,看来keyword tools太不靠谱。

突然又想起另外一篇文章:《CMP读书笔记五:通过并行加速程序》,这篇文章刚写完第二天我就发现被google收录了,并且用关键字“并行加速”搜索还排第一名(链接),可是,这么多天过去了,一个从并行加速关键字过来的访问者也没有。

看来,博客要有流量,只能靠生活类大众类的文章,技术类文章没前途,毕竟技术只是一小部分人的玩具,只有一小部分人会关注。不过,我还是尽量写些技术文章(但必须强调,里面的很多内容可能会有错误!各位读者请自行甄别),谁叫我是一名杯具的工科男呢,偶尔发发生活中的牢骚,无病呻吟下。

另外感概下,google的Pagerank算法做的真的很好,对原创内容相当鼓励,对新站点也很友好,不像百度,话说今天看google一个家伙在MIT上的mapreduce的课件,里面提到了pagerank的基本思想,感觉那思想其实最初很简单,但是就是靠这个算法,诞生了一个互联网巨人,互联网神话。不得不感概,神奇往往就在一瞬间诞生,很多伟大的事物其实出发点(或者说motivation)都是很简单的!

update:刚终于知道为什么平时没人搜的东西突然很多人关注了,原来是韩寒发了《爱的代价》一文,里面推荐了《砰然心动》这部电影,看来韩寒的影响力不容小窥!

Google 首页的变迁史

2011年1月23日 411 条评论 13,492 views

Google终于换CEO了,这距上次换CEO,已经十年过去了,而距这个网络巨人的创立,也才13年不到。在这13年中,google经历了太多的互联网奇迹,也经历了太多互联网灾难(如网络泡沫)。

今天无聊,去http://web.archive.org看了下google主页的变迁历史,一叶而知秋,从google首页的变迁史中,也可以窥探到google的发展史。下面是首页的一些变化的截图(主要来自webarchive,其中部分由于webarchive上的图片无法显示,来自一篇blog):

最早(1998年)的google,看其中的版权信息,发现还是斯坦福的!!!索引的页面数也很少,才两千多万页。也没有Beta信息,从下面的url可以发现,当年google甚至没有自己的域名,但此时I’m feeling lucky却出现了.

http://web.archive.org/web/19981111183552/google.stanford.edu/

1999年的google,出现了beta字样。

2000年的google,beta已去掉。

2000年的google,推出多语言选项。索引的页面数达到1亿。

2001年的google首页。

2002年的google首页,开始出现涂鸦!

2002年的google推出News搜索的首页。

2004年的首页,上面的Froogle不知道为何物。

2005年。


2009年,一个很简洁的页面!!

更多阅读http://web.archive.org/web/*/http://www.google.com

补充阅读:http://blogoscoped.com/archive/2006-04-21-n63.html

PS:我顺便看了下科大的主页历史,发现竟然有千年虫的问题,显示现在时间是111年1月24号。围观地址:http://web.archive.org/web/19970414092124/http://www.ustc.edu.cn/

分类: IT资讯, 随感 标签: , , , ,

google scholar有的搜索结果真扯淡

2011年1月2日 298 条评论 11,387 views

今天要看一些关于芯片可测试性设计的论文,于是去google scholar搜索,不搜不知道,一搜吓一跳,不多解释,自己看链接去:

http://scholar.google.com/scholar?hl=en&q=design+for+testability&btnG=Search&as_sdt=2000&as_ylo=&as_vis=0

下面列出几个排在前面的搜索结果:

Results 110 of about 469,000. (0.09 sec)

[BOOK] The interpretation of cultures

[PDF] from shuchinta.comC Geertz – 1994 – books.google.com
Page 1. LOCAL KNOWLEDGE B A S I c • o 0 lllllllllllllllllllllll CLIFFORD GEERTZ THE
INTERPRETATION OF CULTURES Y E A R S Page 2. Page 3. THE INTERPRETATION
OF CULTURES SELECTED ESSAYS BY Clifford Geertz
Cited by 20237Related articlesAll 14 versions

[BOOK] Institutions, institutional change, and economic performance

[PDF] from odu.eduDC North – 1990 – books.google.com
Matthew D. McCubbins and Terry Sullivan, eds., Congress: Structure and Policy Charles Stewart
III, Budget Reform Politics: The Design of the The choice theoretic approach is essential because
a logically consistent, potentially testable set of hypotheses must be built on a
Cited by 18598Related articlesAll 26 versions

[CITATION] Generalized linear models

P McCullagh… – 1999 – Chapman & Hall, CRC
Cited by 16818Related articlesAll 15 versions

Theory of the firm: Managerial behavior, agency costs and ownership structure

[PDF] from narod.ruMC Jensen… – Journal of financial economics, 1976 – Elsevier
Cited by 21203Related articlesBL DirectAll 67 versions

The problem of social cost

[PDF] from washington.eduRH Coase – Journal of law and economics, 1960 – JSTOR
Page 1. The Journal of LAW c ECONOMIC VOLUME III OCTOBER 1960 THE
PROBLEM OF SOCIAL COST RH COASE University of Virginia I. THE PROBLEM
TO BE EXAMINED1 THIS paper is concerned with those actions
Cited by 15175Related articlesBL DirectAll 98 versions

The iron cage revisited: Institutional isomorphism and collective rationality in organizational fields

[PDF] from archive-host.comPJ DiMaggio… – American sociological review, 1983 – JSTOR
and strategy are less easily noticed. With the advice of a major consulting firm, a large
metropolitan public television station switched from a functional design to a
multidivisional structure. The sta- tions’ executives were skeptical
Cited by 11795Related articlesAll 14 versions

[BOOK] Artificial intelligence: a modern approach

[PDF] from uab.eduSJ Russell… – 2009 – books.google.com
We explain the role of learning as extending the reach of the designer into unknown
environments, and we show how that role constrains agent design, favoring explicit knowl-
edge representation and reasoning. 666 17.6 Mechanism Design . . . . .
Cited by 12920Related articlesAll 32 versions

The magical number seven, plus or minus two: Some limits on our capacity for processing information

[HTML] from soton.ac.ukGA Miller – V, 1956 – books.google.com
There is, to quote a famous senator, a design behind it, some pattern governing its appearances.
There seems to be some limitation built into us either by learning or by the design of our nervous
systems, a limit that keeps our channel capacities in this general range.
Cited by 10886Related articlesBL DirectAll 60 versions

[CITATION] Naturalistic inquiry

YS Lincoln… – 1985 – Sage Publications, Inc
Cited by 16309Related articlesAll 7 versions

Regression models and life-tables

[PDF] from usc.eduDR Cox – Journal of the Royal Statistical Society. Series B ( …, 1972 – JSTOR
The rather strong assumption will be made throughout that the only information available about
the failure time of a censored individual is that it exceeds the censoring time. This assumption
is testable only if suitable supplementary information is available.
Cited by 19899Related articlesAll 8 versions

相比之下,Microsoft academic search给力多了,下面是搜索结果链接:

http://academic.research.microsoft.com/Search?query=design%20for%20testability

也给出几个前面的搜索结果:

Academic

design for testability

any time

Publication (837)

DNS 的 SOA 记录简介

2011年1月1日 259 条评论 32,508 views

今天登入google webmaster,发现有好多crawl错误,一看,都是Domain name not found,连sitemap都是如此,感觉比较严重,于是搜了下该错误,发现还是挺多人碰到该问题,但貌似都没有说什么具体好的解决方法,但有一个回答里提到了一个DNS网站分析网站http://www.intodns.com,于是,试着分析了下我的网站DNS信息,发现竟然有个大红的警告信息,一看是SOA有问题,貌似是我的域名所用的两个DNS服务器ns01.domaincontrol.com,ns02.domaincontrol.com的SOA域信息(主要是序列号)不一致所致,一看具体记录信息,一个是2010122301一个是2010122401,导致google crawler无法验证我的dns服务器。

之后,我想到这应该是由于godaddy自动分配给我的DNS服务器有问题,于是,我想应该换个DNS服务器,但换几个好呢,于是试着查了下grapeot.me的DNS信息,发现其DNS没有错误,于是也把我域名的DNS服务器改成了他所用的ns51和ns52。改好后,等了几分钟貌似就生效了,查了下,貌似没问题,recrawl,成功crawl了!

下面就简要的介绍下 DNS 的 SOA记录吧:

在任何 DNS 记录文件(Domain Name System (DNS) Zone file)中, 都是以SOA(Start of Authority)记录开始。SOA 资源记录表明此 DNS 名称服务器是为该 DNS 域中的数据的信息的最佳来源。SOA 记录与 NS 记录的区别:简单讲,NS记录表示域名服务器记录,用来指定该域名由哪个DNS服务器来进行解析;SOA记录设置一些数据版本和更新以及过期时间的信息.

下面用我的 DNS 的 SOA 记录为例来说明其结构:

The SOA record is:
Primary nameserver: ns51.domaincontrol.com
Hostmaster E-mail address: dns.jomax.net
Serial #: 2010123100
Refresh: 28800
Retry: 7200
Expire: 604800   1 weeks
Default TTL: 86400

源主机(Primary nameserver):

DNS记录文件所在的主机位置。

联系邮箱(Hostmaster E-mail address):

记录主机管理员的联系方式,其中第一个点表示的是@。

序列号(Serial)

格式为yyyymmddnn,nn代表这一天是第几次修改。辅名字服务器通过比较这个序列号是否加载一份新的区数据拷贝。

refresh(刷新):

告诉该区的辅名字服务器相隔多久检查该区的数据是否是最新的。

retry(重试):

如果辅名字服务器超过刷新间隔时间后无法访问主服务器,那么它就开始隔一段时间重试连接一次。这个时间通常比刷新时间短,但也不一定非要这样。

expire(过期或期满):

如果在期满时间内辅名字服务器还不能和主服务器连接上,辅名字服务器就使用这个我失效。这就意味着辅名字服务器将停止关于该区的回答,因为这些区数据太旧了,没有用了。设置时间要比刷新和重试时间长很多,以周为单位是较合理的。

否定缓存TTL(生存期):

这个值对来自这个区的权威名字服务器的否定响应都适用。

一个Microsoft DNS服务器的SOA记录的数据结构如下:

@   IN  SOA     nameserver.place.dom.  postmaster.place.dom. (
                               1            ; serial number
                               3600         ; refresh   [1h]
                               600          ; retry     [10m]
                               86400        ; expire    [1d]
                               3600 )       ; min TTL   [1h]
分类: 技术相关 标签: , , ,

Google releases the in-page analytics

2010年10月22日 176 条评论 52,303 views

Today, when i check my google analytics account, I find a new funtion of analytics:in-page analytics.

Here given a preview of my blog‘s in page-anlytics:

image

In the official blog of google analytics, it is introduced as following:

When looking at Google Analytics reports, sometimes it’s difficult to visualize how visitors navigate on a given website page. To make this visualization easier, some users keep the website open in another browser tab so they can reference it while looking through reports. Others rely on the Site Overlay report in Google Analytics, which, admittedly, hasn’t worked as well it could.

In-Page Analytics. With In-PageAnalytics, you can see your Google Analytics data superimposed on your website as you browse.

You can find the full announcements at the google anlytics blog.

无觅相关文章插件,快速提升流量