江边闲话集

05/30/2008

Joyo搜索框是如何完成中文自动填充的?

Filed under: 一技之长 — Tags: — 张太国 @ 16:37

今天跑到Joyo网去看看我需要的书到货没有,顺便搜索了一下其他书籍,我发现有自动填充,原来没有发现呢。汗颜。

案例:

如果我输入de,下面会有”德语“,”德川家康“等条目出现,伴随有多个搜索结果。

 

问题:

Joyo是怎么实现的呢?

 

分析:

当然我不可能看到其源代码和数据库schema。下面按照我自己的思路来解决这个问题。

首先看看Joyo网的效果:

  • 当你输入”de”,会出现以下结果:

         

         我们可以看到会出现以”de“发音的汉字,当然也包括英文。

  • 当输入”deyu”会是什么效果呢?看图:

         

       这是输入一整个”deyu“的拼音,所以下面都是以德语开头的,当然要是下面有“德育”的,也会显示的。

 

  • 看看输入”de yu“会是什么效果?我猜是没有结果。事实上也是:

        

        这说明是中间不能有空格的,除非“德语”是“德 语”,下面才有结果。

 

从上面你能得出什么结论?

我的结论是:

  • 拼音是按照汉语的顺序来的,如果有空格,那么拼音的相应位置也有空格。例如”德语”对应是”deyu”,”德 语”则是”de yu”。
  • 字母区分大小写的。

 

既然有上面的结论,那么怎么去做呢?对于程序不大的,很简单,直接在数据库里设置。

假设数据库里有一个表名叫item_t.之所以选择item,那是因为Joyo买书,卖CD等各种商品,所以不能以book_t来代替。

item_t应该有如下字段:

  • id    每本书的id
  • price 每本书的价格
  • name 每本书的名字,是中文就是中文,是英文就是英文
  • name_alias 用来存储上面的拼音的。

 

这里特别要介绍一下name_alias,这个field是关键。在录入的时候应该存储相应的拼音。按照一般习惯,英文书名应该存储英文。汉字的存储拼音。

 

实现

既然有了上面的分析,还有什么不能解决的呢。很明显要用到ajax技术。为了查找精确,应该到name,name_alias来2个field都查询。写一条SQL:

 SELECT id,name FROM item_t WHERE name LIKE “%keyword_you_search% OR name_alias LIKE ‘%keyword_you_search%’

你也许会问,这里输出的是整个书名啊,和输出结果有出入。的确如此。

那么Joyo到底是怎么做的?我猜想她将每个用户输入的关键字都存储起来的。这样在查询就方便一些。但是最终也不会离不开第一步。

 

引申

有人也许会问,你说的也太简单了吧,那么Google中国会怎么处理呢?我也不知道。

单从Google首页来看,其实和joyo差不多。但是有个问题是Google应该不太会用SQL Server或Oracle等数据库的做法去存储,因为这非常不利于查询等操作。

所以上面的name_alias可能行不通,不然每次都需要人工去输入,这得多大的功夫。唯一可能的就是自动去处理。

如何处理呢?最差的一种就是将每个汉字的拼音都拿出来。相信这也不是什么难事,不然Google的输入法是怎么做出来的呢。

接下来的事情怎么做,我想大家都知道。

 

更多

这里不介绍Ajax的使用方法,有人可能会提到没法输出中文,这些都是基本知识啦,这里不详述。

最后欢迎大家拍砖。

05/29/2008

生活之美之一:态度

Filed under: 闲情逸致 — 张太国 @ 17:50

这些天,一直词在我脑海里打转转,这就是生活的态度

也不知道从什么时候开始自己有了生活的态度。在我记忆中,形成一种强烈的态度是在大三。当时马克思等哲学原理都学完了,更深刻的理解了什么是世界观和人生观。这时我对生活的态度才有了一个定性的认识。

我们都知道生活的态度不可能在大学几年就能形成的,它和自己以前的学习环境,生活环境,以及家庭背景等多重复杂的内外因素有关。大二到大三那个暑假对于我来说是一个不平凡的一段时间。这一年我懂得了朋友之间的友情珍贵,也懂了生活应该保持乐观向上。也正因为如此,让我度过了大部分人都认为极其无趣的时光。

多年来我一直以这种信念支撑着自己。2004年至2005年这段时间,和一个女孩子开始熟悉起来,事实上我很早就认识她,只不过那时候不是太熟悉而已。她给我的感觉她自己心里有个极其强烈的信念。甚至有时候这个信念令他最亲近的人有时候不知所措。也许我是受她的感染,整个人都变得和他一样。有一次她对我说,要不是你心里一直个信念,我相信你已经倒了。当时我听见这句话说时,我也感到很诧异。当时因为工作的关系,我变得特别忙,但是对生活,对工作都是一种积极的态度。自从那个时候,我开始晚上跑步,每天大约1个小时。

每个人对生活的态度都不一样,这也直接决定了世界观和价值观。这样每个人选择的生活方式都不一样了。有人认为对现在的生活知足了,所以开始怠慢自己,觉得再也没有生活的目标。有人认为这样的生活并不好,于是努力奋斗,争取过的更好一些。还有人其实对现在生活挺满足的,但是总认为自己不应该平平淡淡的生活着,而是应该过一种有激情,有意义的生活。

对于第一种,我个人认为不是我喜欢的那种。至于后面2种,我觉得还是不错的。当然,我的这种选择已经侧面反映了我自己的选择。

很多人根本不知道自己应该干什么,这是可悲的。

前些天,也认识一个女孩子,她给我引用了许三多的一句话:好好活就是干有意义的事,有意义的事就是好好活。这也充分体现她的一种态度。

有朋友一直抱怨现在太无聊了,想找回自己原来的那些激情,其实这种状态目前我也有。最后我们讨论得出一个结论:如果本质上是一个有积极的人,那么暂时的失去并不可怕,如果换个环境还会找回来的

态度,决定了去做什么事情。

InstallShield安装时出现“1152:error extracting"的解决方案

Filed under: 一技之长 — Tags: — 张太国 @ 12:55

InstallShield制作的安装文件可能会出现”1152:error extracting”错误。那么应该怎么解决呢?

如果安装的是英文操作系统,这个问题一般不太会出现,但是是中文系统或者韩文操作系统,这个问题就很有可能出现,不管是XP,2K,还是server。

到底为什么会出现这种错误呢?

答案是安装时可能会涉及到一些特殊的字符(例如版权符号等),而这些字符在中文系统下不一定会识别。当然可能会有其他原因。

至于最常见的原因可以参看Installshield的官方解决方案,Q107317: ERRDOC: Setup.exe Error 1152

无非就是重新下载,temp的权限修改。

下面介绍的是我自己的安装经历:

我的机器是Windows server 2003,中文版的。安装时出现上述错误。不得已,跑到英文版上的去安装,成功了。于是我检查了一下windows installer的版本,是最新版本的,然后再检查temp的权限,改成writable,但是还是不行。

一不小心发现安装的界面上有几个乱码,于是想是不是这个方面的原因呢?突然想起3年前编译个项目因为里面有些法文字符,改一下区域和语言设置解决了问题。于是跑到控制面板里将里面的所有设置都修改英文的。重启机器。然后安装,搞定。但是同时我发现我机器上很多原来显示正常的中文现在不正常了,于是又改了回来。

想想真是够麻烦的。

05/28/2008

人们需要更多的关怀

Filed under: 闲情逸致 — 张太国 @ 20:05

今天同事发给我一个链接,说的是萨朗斯通的”报应论“,看到这篇文章,我愤怒了。

地震给四川人民带来了无限的痛苦,然而萨朗斯通不仅不表示出应有的态度,而是抛出一个报应论,难怪北京各大院线封杀她呢。

在这里,我们不追求你能多理解他们,但是请不要作出一些影响大家的事情。

我经历过98年特大洪水,所以对这次地震中的同胞们的心情表示理解。在我们生活中,很多离四川比较远的地区,或者从来没有经过什么自然灾害的人是没法理解这些的。即使能够理解,也不能理解深刻。

当地震的那一刻,我觉得这次能给人们带来无限的伤痛,这对很多人来说,也许这辈子没法忘记,没法忘记地震给他们带来肉体和精神上的巨大创伤。这几天,很多人面临着失去亲人的痛苦,即使没有,也要面对如今这场灾难,灾难过后,还要面对重建。

每天从媒体上看到死亡的数字几千几千的增加,我们又有什么感想?这不仅仅是一个数字而已,这意味着不知道有多少家庭失去亲人。这些失去亲人的家人现在有多痛苦,甚至比自己家的房子倒塌,比灾后重建来的更重更远一些。

所以如果你是一个有良知的同胞,请拿出自己的真心去关心每一位吧,他们也需要你的光怀和帮助。

从另一个角度看,人有时候需要将心比心,不然是没法知道别人的想法和心情

你能理解四川人民的心吗,现在?

05/22/2008

李香兰

Filed under: 闲情逸致 — Tags: — 张太国 @ 17:45

相信很多人都听过<<李香兰>>这首歌,但是知道李香兰究竟是什么意思吗?

挺这首歌是读高中的时候,当时以为是一花呢。到了大学才专门去找了一些相关的资料。张学友的这首歌也是我最爱的歌曲之一。

说说李香兰吧:

  • 李香兰,是日本人,本名叫山口淑子。
  • 因其祖父酷爱中国文化,于1906举家迁到中国。
  • 1920年,李香兰出生。
  • 1933年,她父亲的干兄弟,沈阳银行的经理李季认他为义女,取名李香兰,这样就有了中文名。
  • 1933年,发现自己染上肺病,为了治病,决定学习声乐,因为声乐可以锻炼肺部的活动量。
  • 1945年,李香兰在上海的大光明大戏院举行个人演唱会“夜来香幻想曲”。
  • 1945年,日本战败,李香兰以汉奸罪被国民政府逮捕。但随后在证明了她的日本移民身份后,她被无罪释放并于1946年2月遣送回日本。
  • 1947年,改回原名山口淑子,在日本继续其演艺事业,为东宝、松竹拍了一系列电影。并于20世纪50年代末来到香港,为邵氏兄弟有限公司拍摄电影。
  • 1951年,嫁给了美国的雕刻艺术家野口勇
  • 1956年,离婚。
  • 1958年,嫁给外交官大鹰弘后,冠夫姓成为大鹰淑子,并告别舞台转而从政。大鹰弘当时为日本驻联合国大使加藤俊一的秘书官、三等书记官。
  • 1974年,被自由民主党提名,当选参议院议员
  • 1980年及1986年成功连任。历任环保政务次官、参议院冲绳及北方问题事务特别委员会委员长、参议院外务委员会委员长、自民党妇人(女)局长。
  • 1993年11月3日、获颁授勋二等宝冠章。
  • 2005年李香兰发表长文,劝诫日本首相不要参拜靖国神社,原因是“那会深深伤害中国人的心。”

 

李香兰是花腔女高音,而且受过正式的西洋声乐教育,很擅长美声唱法。她的代表作有歌曲《夜来香》《恨不相逢未嫁时》《海燕》《不要告诉我》《三年》《兰闺寂寂》《梅花》《小时候》《十里洋场》《分离》《心曲》等等

张学友的<<李香兰>>,作曲是日本的歌手玉置浩二,作词周礼茂,歌词如下:

恼春风
我心因何恼春风
说不出
借酒相送
夜雨冻
雨点透射到照片中
回头似是梦
无法弹动
迷住凝望你
褪色照片中

像花虽未红
如冰虽不冻
却像有无数说话
可惜我听不懂

是杯酒渐浓
或我心真空
何以感震动
照片中
那可以投照片中
盼找到
时间裂缝
夜放纵
告知我难寻你芳踪
回头也是梦
仍似被动
逃避凝望你
却深印脑中

像花虽未红
如冰虽不冻
却像有无数说话
可惜我听不懂

是杯酒渐浓
或我心真空
何以感震动
music

像花虽未红
如冰虽不冻
却像有无数说话
可惜我听不懂

是杯酒渐浓
或我心真空
何以感震动

以上是粤语的,对应的是国语<<秋意浓>>.

 

以上部分内容来自维基百科。参看这里:http://en.wikipedia.org/wiki/Yoshiko_Otaka

Flickr升级

Filed under: I.T — 张太国 @ 12:51

最近把Flickr的账户变成Pro了。但是后来银行告诉我多花了1美元。这令我诧异。于是看了一账单,发现2笔交易时间非常接近,大概20s左右。

尽管钱不多,但是还是要搞明白的,直接发了一个email过去。

过了一天,他们billing team的工作人员回复了一下,原来才知道是这么回事。内容如下:

Thank you for your recent email enquiry regarding Flickr Billing General.
We appreciate your inquiry in this regard. However, please
take note that Yahoo! will not settle the $1.00 amounts on your
statement. These are simply an anti-fraud verification process and they are
considered pre-authorization charges.  You should see them fall off of
your creditcard statement within a few days depending on your bank. I hope this
clears up the issue.

If you have any additional questions or comments, please feel free to contact us again.

Regards,
John
Yahoo! Customer Care
For assistance with all Yahoo! services please visit:
http://help.yahoo.com/

 

 

既然人家都这么说了,当然没有问题啦。就等过几天再看看吧。

对<<南风窗>>的质疑

Filed under: 闲情逸致 — Tags: — 张太国 @ 12:44

阅读<<南风窗>>这本杂志已经有10多年了,基本上每期都看,所以也算的上是一个忠实的读者了。

今天想买最近的一期,于是跑到常买的那个报刊亭去买。老板告诉我已经不卖了。我问为什么?老板的回答令我很吃惊:销量不好。这让我不得不再思考这个问题。

地球人都知道,南方的媒体报刊远比上海和北京这一地区要发达,这不仅仅是因为南方最先改革开放,而且与他们的一些性格有很大关系。这里说的南方尤以广州和深圳为主。我常看的就有《南风窗》以及《南方周末》(该报纸算起来也有10来年了)。

既然有如上面的原因,为什么我还是买不到呢?答案如下:

  • 读者应该越来越少

这是很重要的,如今这个社会,到处都充满着浮躁的空气。有几个人能拿着这样一本政经而且严肃的杂志那里看呢?看这本杂志的人年龄群体应该在20-40比较多,很明显这里有一层20-30岁的群体,我想还是有相当一部分人在这个社会里略显浮躁,都是社会所逼呀。据我所观察,如今很少看到那这本或者相关的杂志,倒是被一些娱乐等媒体所代替。

  •   内容越来越令人乏味

不知道什么原因,我觉得内容越来越乏味。不是对主题蜻蜓点水,就是瞎搬一些看破皮的理论来。说白了就是没有深度,而且一直是那么几个作者在那里写来写去,都写了好多年了。

  • 改版

原来是一月出一本,后来变为一月出两本,最近变成每两周出一本。价格也是逐步提高,6块钱到6.5块,最后到现在的8块。个人觉得有点信息过载了。

  • 销售渠道

真是令人纳闷,居然采用包销的方式。也就是说每个摊位定了10本,就要把10本卖完,要是卖不完的,不能退。而不是代销,就拿我常看的<<中国国家地理>>来说,16块钱一本,但是它是代销的,卖不完的可以退回。这样一比较,能有哪个人会愿意去承担不必要的风险呢?人家卖其他的也是卖,卖这个也是卖,为什么不捡风险小的呢。我觉得市场部门真得考虑一下这个问题了。遗憾的是,我走过很多书报亭,真的没有几家在卖的,原来卖的几家现在都不卖了。唉!上海如此,就不用提其他地方了

 

总的来说,南风窗就目前的市场而言还是不错的。唯一遗憾的是我已经有2期没有买到了。不是不想买,真的买不到。

05/18/2008

地震

Filed under: 闲情逸致 — 张太国 @ 20:41

这几天所有的媒体报道四川的地震,电视,报纸,网络.国内国外,无一不是.

今天下午打开网页,遇难人数已增加到32,477,但是昨天却是28,881人.看到这些数据,心里感到莫名的心痛.真的体会到生命如此之轻.也许正因为此,我们才能体会到目前的生活真幸福.

今天上午去徐家汇移动营业厅半点事情,顺道看见几个小弟弟小妹妹拿着爱心箱子希望行人捐款.我毫不犹豫走上去打开钱包拿出自己一张100捐了,我看了一下爱心箱子的钱,一般都是5块10块.这些小弟弟小妹妹一直谢我,也许他们认为我捐的多了一些吧,我还真不好意思,尽管前几天刚刚通过其他途径捐过.我一直认为在自己力所能及的范围内多帮助那些同胞们是应该的.

刚刚获悉国务院决定5月19日至21日为全国哀悼日 将下半旗志哀

内容为:

新华网北京5月18日电 据中国政府网报道,国务院今天发布公告宣布,为表达全国各族人民对四川汶川大地震遇难同胞的深切哀悼,国务院决定,2008年5月19日至21日为全国哀悼日。公告全文如下:

 国务院公告

  为表达全国各族人民对四川汶川大地震遇难同胞的深切哀悼,国务院决定,2008年5月19日至21日为全国哀悼日。在此期间,全国和各驻外机构下半旗志哀,停止公共娱乐活动,外交部和我国驻外使领馆设立吊唁簿。5月19日14时28分起,全国人民默哀3分钟,届时汽车、火车、舰船鸣笛,防空警报鸣响。

以上来自sina.

我觉得ZF就应该这么做.

最后贴一张我附件商店门前的一张图片:

05/12/2008

地震

Filed under: 闲情逸致 — 张太国 @ 17:42

今天地震了。

四川,湖北,浙江,上海,北京,天津…..都地震了。不过我没有感觉到,可能是我们写字楼太防震了吧。

第一时间看网友通过IM报道了这一事件。接着是Leaf给我留言说地震了,这是我才意识到是真的,第一件事情是给Leaf打了一个电话,知道北京和天津都地震了。接着是我们同事接到一个电话,说浦东地震了,我才意识到上海也地震了呀。连徐家汇都持续了5分钟,那么为什么我感觉不到呢?

这个时候给老哥打了一个电话,因为他今天出门。还好,一切安好。

打开网页浏览了一下,四川发生7.8级地震,太厉害了。想想离老家不是特别远,于是打电话回家,家里电话没有人接,我开始放心了,至少没有打不通的情况出现。也许父母出去农忙了,也许他们在新家里。我担心的就是这个老屋,二十几年了,哪能经得起折腾呢。

晚上再打一个电话确认一下。

但愿这次不会给人们带来沉重的损失。Bless!

05/02/2008

德川家康

Filed under: 闲情逸致 — Tags: — 张太国 @ 20:20

我对日本历史不懂,所以德川家康我也不熟悉,

前些日子去书店溜达了一圈,发现堆着德川家康的书,于是乎买了一本看看.当天看了之后发现不错,然后在卓越网上把剩下的已出版的5本全部买了,这样只能慢慢啃了,

该系列是由柏杨策划,南海出版发行公司负责发行,总共由13部,目前已经出版6部.看了一下版次,感觉销量应该不错的.看看柏杨说的:

 中文图书,唯《三国演义》、《资治通鉴》可与之媲美。

该图书讲述了德川家康,织田信长,丰臣秀吉这些日本的著名历史人物,这些任务生在日本的战国时代.中国有战国,日本也有.日本这点土地上冒出这么多城,而且各自为王,所以总得有个人来统一.

也许是该作者山岗庄八经历了在二次世界大战的原因,所以在本书里可以体会到明显的反战心理.这本书其实对于中国读者而言,感觉有点太简单,不像四大名著那样写的那么生动,也不想金庸写武侠那样那么过瘾.即便如此,仍然值得一看.从中可以了解到日本的历史,日本人的一种心态,日本的文化等等.

刚开始读起来有点吃力,因为里面的人名真是有点摸不着头脑,可能是自己对日本名不熟悉.看完几章之后就习惯了.另外,因为一些人物和事件不懂,所以维基百科了一下.这样看起来会更容易,理解的更深入.

第一部你很可能不知道哦啊德川家康是谁,到了第二部前半部隐隐约约知道了,到了后半部基本上知道了.到了最后几张,作者将德川家康点名.为什么会出现这种情况?和作者的思维有关系,另外和日本文化有关.如中国的文化一样,到了年龄就会改名,所以前面你根本不知道德川家康是谁.除非你对日本历史挺了解的.

该系列翻译的挺不错的,文章挺流畅,而且很符合中文习惯.这是不多见的翻译质量优秀的作品.

目前给我印象最深刻的就是德川家康的母亲于大,真的很了不起.

 13 部分别为:

  • 第一部 乱世孤主
  • 第二部 崛起三河
  • 第三部 天下布武
  • 第四部 兵变本能寺
  • 第五部 龙争虎斗
  • 第六部 双雄罢兵
  • 第七部 南征北战     (卓越2008-05-20有货)
  • 第八部 枭雄归尘      (卓越2008-05-31有货)
  • 第九部 关原合战     (卓越2008-06-30有货)
  • 第十部 幕府将军     (卓越2008-07-31有货)
  • 第十一部 王道无敌 (卓越2008-08-31有货)
  • 第十二部 大阪风云 (卓越2008-09-30有货)
  • 第十三部 长河落日 (卓越2008-09-30有货)

不知道何时才能出完,也许打个电话到出版公司问问更合适.

刚刚在卓越网上看,后面的几部开始预售了.

哈哈,等我把前面几部看完了再买也不迟.

Older Posts »

Powered by WordPress