Create Your Own Search Engine with Python (一)
Create Your Own Search Engine with Python
用python创建你自己的搜索引擎(一)
在特定的网站上搜索你需要的网页,我想,这是一个非常有用的功能。然而,搜索系统不是那么简单,提供优质的搜索性能需要多种编程语言的知识。本文将演示一个简单的搜索引擎,它包含一个可以在你自己的网站上运行的简单应用。该应用也是python编程语言很好的入门教程。
这个应用是Python, JavaScript, CSS 和 HTML的结合。它可以在任何支持CGI和 PYTHON的服务器上运行。一些配置:Python版本为 2.5.1,Apache HTTP服务器, 而JavaScript 和 格式表单已经在IE,Firefox 和 Safari 上试过,保证可用。
这个应用的代码是免费的,根据Apache 2.0 license发布。也就是说欢迎你使用、拷贝和修改代码,一切随意。如果你发现了bugs,或有什么意见和建议,代码性能得到提升,我很高兴你能和我联系。另外还需要一些其它的程序来运行这个应用。它们也是免费的,不过有些使用的是不同的license。在使用这些产品之前,你应该阅读下这些license。
Setup
安装
Get the
SOURCE CODE
获取源代码(这部电影貌似挺赞的)
首先,你要下载源代码。下载地址here。下载好了,肯定就是解压什么的了,这个不用我解释了吧?
别的程序
这个搜索引擎程序是用python 解释器来运行的。所以,没有python?装个呗!安装了python才能使用这个这个程序。
本程序还可以在本地运行进行测试,只要个HTTP服务器就可以运行了。这个HTTP服务器支持CGI就可以运行程序,测试的话,就只能是Apache HTTP server 。
运行示例程序
只要你已经安装好python 和 Apache HTTP server,你可以根据以下步骤来运行了。过程中,会生成一个HTML文件,里面包含搜索的结果。你可以使用管道将这些输出到另一个文件,再用你的浏览器打开它。你可能需要把可执行的python添加到你的路径中,或是根据你的系统设置,给可执行的python指明完整的路径。
1 解压文件到某个目录。
2 打开一个命令行终端,改到你解压的目录下。
3 你可以运行这个命令python search.py > searchoutput.html 用于在本地测试。
这个应用程序已经配置好了,通过命令行接口运行可以很轻松地控制和测试。在web服务器上的配置会在后文中讲解。
核心技术
本程序的核心技术有:
§ Python
§ JavaScript
§ Cascading Style Sheets
§ HTML
这个应用程序是个有用的网站搜索引擎示例。也是python,CSS,javascript和html等内容很好的入门教程。它完整地展示了如何使用这三种技术(三种?)来创建一个有价值、可配置的用户接口,用于搜索你的应用程序。(原文直译成这样,好像不太通)
为什么是Python(让我想起了豆瓣上,为什么是python而不是ruby/php……的争论)
现在存在很多web脚本语言和工具。perl和ruby是最先映入脑海中的,但是还有很多很多可供选择。python是一种动态类型、面向对象的语言。和java相比,python可以改变对象的类型。python不同于java,它不需要把所有的代码都放到对象(或类)里面。如果不使用面向对象编程的话,python看上去更像个传统的脚本语言。
PERL有着独特的语法,比较难学,而ruby多半依赖于RAILS框架。它们都很流行,也可以轻松地用它们来实现这个应用程序。使用perl,ruby,python的争论一直在持续,我可不打算在这里介绍一遍。这个应用程序可以用任一种语言来实现。而python正好是我在写这个代码时最感兴趣的语言,所以 你懂的(豆瓣也差不多吧,一切都是巧合而成,而不是真的纠结于语言的那一点特性。)