📜  Python文本处理环境

📅  最后修改于: 2020-11-06 06:12:34             🧑  作者: Mango


为了成功创建并运行本教程中的示例代码,我们需要一个环境设置,该环境应同时具有通用Python和数据科学所需的特殊软件包。我们首先看一下为安装通用的Python可以是Python2或Python 3。但是,我们会更喜欢Python2本教程主要是因为它的成熟和更广泛的支持外部包。

获取Python

最新的源代码,二进制文件,文档,新闻等可在Python https:// www的官方网站上找到。 Python.org /

您可以从https:// www下载Python文档。 Python.org / doc / 。该文档有HTML,PDF和PostScript格式。

安装Python

Python发行版可用于多种平台。您只需要下载适用于您的平台的二进制代码并安装Python。

如果平台的二进制代码不可用,则需要C编译器来手动编译源代码。在安装所需的功能选择方面,编译源代码可提供更大的灵活性。

这是在各种平台上安装Python的快速概述-

Unix和Linux安装

以下是在Unix / Linux机器上安装Python的简单步骤。

  • 打开Web浏览器,然后转到https:// www。 Python.org / downloads /

  • 单击链接下载适用于Unix / Linux的压缩源代码。

  • 下载并解压缩文件。

  • 如果要自定义某些选项,请编辑“模块/设置”文件。

  • 运行./configure脚本

  • 使

  • 进行安装

这会将Python安装在标准位置/ usr / local / bin中,并将其库安装在/ usr / local / lib / pythonXX中,其中XX是Python的版本。

Windows安装

以下是在Windows计算机上安装Python的步骤。

  • 打开Web浏览器,然后转到https:// www。 Python.org / downloads /

  • 单击Windows安装程序python-XYZ.msi文件的链接,其中XYZ是您需要安装的版本。

  • 要使用此安装程序python-XYZ.msi ,Windows系统必须支持Microsoft Installer 2.0。将安装程序文件保存到本地计算机,然后运行它以查找您的计算机是否支持MSI。

  • 运行下载的文件。这将弹出Python安装向导,该向导非常易于使用。只需接受默认设置,等待安装完成即可。

Macintosh安装

最近的Mac装有Python ,但可能已经过时了。请参阅http:// www。 Python.org / download / mac /获取有关获取当前版本以及支持Mac上开发的其他工具的说明。对于Mac OS X 10.3(2003年发布)之前的旧Mac OS,可以使用MacPython。

杰克·詹森(Jack Jansen)对此进行了维护,您可以在他的网站( http://www.cwi.nl/~jack/macpython.html)上完全访问整个文档。您可以找到Mac OS安装的完整安装详细信息。

设置路径

程序和其他可执行文件可以在许多目录中,因此操作系统提供了搜索路径,该路径列出了OS搜索可执行文件的目录。

路径存储在环境变量中,该变量是操作系统维护的命名字符串。此变量包含命令外壳和其他程序可用的信息。

路径变量在Unix中被命名为PATH,在Windows中被命名为Path(Unix区分大小写; Windows不区分大小写)。

在Mac OS中,安装程序将处理路径详细信息。要从任何特定目录调用Python解释器,必须将Python目录添加到路径中。

在Unix / Linux上设置路径

要将Python目录添加到Unix中特定会话的路径-

  • 在csh shell中-键入setenv PATH“ $ PATH:/ usr / local / bin / Python”,然后按Enter。

  • 在bash shell(Linux)中,键入export ATH =“ $ PATH:/ usr / local / bin / Python”并按Enter。

  • 在sh或ksh shell中-键入PATH =“ $ PATH:/ usr / local / bin / Python”并按Enter。

  • 注意-/ usr / local / bin / Python是Python目录的路径

在Windows上设置路径

要将Python目录添加到Windows中特定会话的路径-

在命令提示符下-键入path%path%; C:\ Python ,然后按Enter。

注意-C:\ Python是Python目录的路径

Python环境变量

这是重要的环境变量, Python可以识别它们-

Sr.No. Variable & Description
1

PYTHONPATH

It has a role similar to PATH. This variable tells the Python interpreter where to locate the module files imported into a program. It should include the Python source library directory and the directories containing Python source code. PYTHONPATH is sometimes preset by the Python installer.

2

PYTHONSTARTUP

It contains the path of an initialization file containing Python source code. It is executed every time you start the interpreter. It is named as .pythonrc.py in Unix and it
contains commands that load utilities or modify PYTHONPATH.

3

PYTHONCASEOK

It is used in Windows to instruct Python to find the first case-insensitive match in an import statement. Set this variable to any value to activate it.

4

PYTHONHOME

It is an alternative module search path. It is usually embedded in the PYTHONSTARTUP or PYTHONPATH directories to make switching module libraries easy.

运行Python

有三种不同的启动Python-

互动翻译

您可以从Unix,DOS或任何其他提供命令行解释器或Shell窗口的系统中启动Python 。

在命令行输入Python

立即在交互式解释器中开始编码。

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

这是所有可用命令行选项的列表-

Sr.No. Option & Description
1

-d

It provides debug output.

2

-O

It generates optimized bytecode (resulting in .pyo files).

3

-S

Do not run import site to look for Python paths on startup.

4

-v

verbose output (detailed trace on import statements).

5

-X

disable class-based built-in exceptions (just use strings); obsolete starting with version 1.6.

6

-c cmd

run Python script sent in as cmd string

7

file

run Python script from given file

命令行脚本

通过在应用程序上调用解释器,可以在命令行执行Python脚本,如下所示-

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

注意-确保文件许可模式允许执行。

集成开发环境

您可以从图形用户界面(GUI)环境中运行的Python为好,如果你有一个支持Python系统上的GUI应用程序。

  • Unix -IDLE是第一个用于Python的Unix IDE。

  • Windows -PythonWin是Python的第一个Windows界面,并且是带有GUI的IDE。

  • Macintosh-可以从主网站上获得Macintosh版本的Python和IDLE IDE,可以将其下载为MacBinary或BinHex文件。

安装NLTK包

NLTK非常直接地集成到Python环境中。使用以下命令将NLTK添加到环境中。

sudo pip install -U nltk

在需要在Python程序中使用它们时,将在每章中讨论其他库的添加。