《Python编程:从入门到实践》学习笔记
要读取文件,需要一个包含几行文本的文件。下面首先来创建一个文件,它包含精确到小数
点后30位的圆周率值,且在小数点后每10位处都换行:
pi_digits.txt
3.1415926535
8979323846
2643383279
下面的程序打开并读取这个文件,再将其内容显示到屏幕上:
- with open('pi_digits.txt') as file_object:
- contents = file_object.read()
- print(contents)
open()函数:表示打开文件;关键字with在不再需要访问文件后将其关闭;使用方法read()读取这个文件的全部内容,并将其作为一个长长的字符串存储在变量content中。
print(contents.rstrip()) Python方法rstrip()删除(剥除)字符串末尾的空白。现在,输出与原始文件的内容完全相同
运行结果:
3.1415926535
8979323846
2643383279
当你将类似pi_digits.txt这样的简单文件名传递给函数open()时,Python将在当前执行的文件(即.py程序文件)所在的目录中查找文件。根据你组织文件的方式,有时可能要打开不在程序文件所属目录中的文件。
在Linux和OS X中,你可以这样编写代码:
with open('text_files/filename.txt') as file_object:
这行代码让Python到文件夹python_work下的文件夹text_files中去查找指定的.txt文件。在
Windows系统中,在文件路径中使用反斜杠(\)而不是斜杠(/):
with open('text_files\filename.txt') as file_object:
注意 Windows系统有时能够正确地解读文件路径中的斜杠。如果你使用的是Windows系统,且结果不符合预期,请确保在文件路径中使用的是反斜杠。
读取文件时,常常需要检查其中的每一行:你可能要在文件中查找特定的信息,或者要以某种方式修改文件中的文本。
要以每次一行的方式检查文件,可对文件对象使用for循环:
- filename = 'text_file\pi_digits.txt'
- with open(filename) as file_object:
- for line in file_object:
- print(line.rstrip())
运行结果:
3.1415926535
8979323846
2643383279
使用关键字with时,open()返回的文件对象只在with代码块内可用。如果要在with代码块外访问文件的内容,可在with代码块内将文件的各行存储在一个列表中,并在with代码块外使用该列表:你可以立即处理文件的各个部分,也可推迟到程序后面再处理。
下面的示例在with代码块中将文件pi_digits.txt的各行存储在一个列表中,再在with代码块外打印它们:
- filename = 'text_file\pi_digits.txt'
- with open(filename) as file_object:
- lines = file_object.readlines()
-
- for line in lines:
- print(line.rstrip())
方法readlines()从文件中读取每一行,并将其存储在一个列表中;接下来,该列表被存储到变量lines中;在with代码块外,我们依然可以使用这个变量。最后,我们使用一个简单的for循环来打印lines中的各行。由于列表lines的每个元素都对应于文件中的一行,因此输出与文件内容完全一致。
运行结果:
3.1415926535
8979323846
2643383279
将文件读取到内存中后,就可以以任何方式使用这些数据了。
- filename = 'text_file\pi_digits.txt'
- with open(filename) as file_object:
- lines = file_object.readlines()
-
- pi_string = ''
- for line in lines:
- pi_string += line.strip()
-
- print(pi_string)
- print(len(pi_string))
运行结果:
3.141592653589793238462643383279
32
注意 读取文本文件时,Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数int()将其转换为整数,或使用函数float()将其转换为浮点数。
保存数据的最简单的方式之一是将其写入到文件中。通过将输出写入文件,即便关闭包含程序输出的终端窗口,这些输出也依然存在:你可以在程序结束运行后查看这些输出,可与别人分享输出文件,还可编写程序来将这些输出读取到内存中并进行处理。
要将文本写入文件,你在调用open()时需要提供另一个实参,告诉Python你要写入打开的文件。为明白其中的工作原理,我们来将一条简单的消息存储到文件中,而不是将其打印到屏幕上:
- filename = 'programming.txt'
- with open(filename, 'w') as file_object:
- file_object.write("I love programming.")
在这个示例中,调用open()时提供了两个实参。第一个实参也是要打开的文件的名称;第二个实参('w')告诉Python,我们要以写入模式打开这个文件。打开文件时,可指定读取模式('r')、写入模式('w')、附加模式('a')或让你能够读取和写入文件的模式('r+')。如果你省略了模式实参,Python将以默认的只读模式打开文件。
如果你要写入的文件不存在,函数open()将自动创建它。然而,以写入('w')模式打开文
件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件。
我们使用文件对象的方法write()将一个字符串写入文件。这个程序没有终端输出,但如果你打开文件programming.txt,将看到其中包含如下一行内容:
programming.txt
I love programming.
注意 Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str()将其转换为字符串格式。
函数write()不会在你写入的文本末尾添加换行符,因此如果你写入多行时需要加指定换行符:
- filename = 'programming.txt'
- with open(filename, 'w') as file_object:
- file_object.write("I love programming.\n")
- file_object.write("I love creating new games.\n")
现在,输出出现在不同行中:
programming.txt
I love programming.
I love creating new games.
像显示到终端的输出一样,还可以使用空格、制表符和空行来设置这些输出的格式。
如果你要给文件添加内容,而不是覆盖原有的内容,可以附加模式打开文件。你以附加模式打开文件时,Python不会在返回文件对象前清空文件,而你写入到文件的行都将添加到文件末尾。如果指定的文件不存在,Python将为你创建一个空文件。
下面来修改write_message.py,在既有文件programming.txt中再添加一些你酷爱编程的原因:
- filename = 'programming.txt'
- with open(filename, 'a') as file_object:
- file_object.write("I also love finding meaning in large datasets.\n")
- file_object.write("I love creating apps that can run in a browser.\n")
open(filename, 'a') ,打开文件时指定了实参'a',以便将内容附加到文件末尾,而不是覆盖文件原来的内容。我们又写入了两行,它们被添加到文件programming.txt末尾:
programming.txt
I love programming.
I love creating new games.
I also love finding meaning in large datasets.
I love creating apps that can run in a browser.
当你认为可能发生了错误时,可编写一个try-except代码块来处理可能引发的异常。
- try:
- print(5 / 0)
- except ZeroDivisionError:
- print("You can't divide by zero!")
运行结果:
You can't divide by zero!
很多程序都要求用户输入某种信息,如让用户存储游戏首选项或提供要可视化的数据。不管专注的是什么,程序都把用户提供的信息存储在列表和字典等数据结构中。用户关闭程序时,你几乎总是要保存他们提供的信息;一种简单的方式是使用模块json来存储数据。
模块json让你能够将简单的Python数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。你还可以使用json在Python程序之间分享数据。更重要的是,JSON数据格式并非Python专用的,这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便式,很有用,也易于学习。
注意 JSON(JavaScript Object Notation)格式最初是为JavaScript开发的,但随后成了一种常见
格式,被包括Python在内的众多语言采用。
函数json.dump()接受两个实参:要存储的数据以及可用于存储数据的文件对象。
- import json
- numbers = [2, 3, 5, 7, 11, 13]
- filename = 'numbers.json'
- with open(filename, 'w') as f_obj:
- json.dump(numbers, f_obj)
这个程序没有输出,但我们可以打开文件numbers.json,看看其内容。数据的存储格式与
Python中一样:
[2, 3, 5, 7, 11, 13]
下面再编写一个程序,使用json.load()将这个列表读取到内存中:
- import json
- filename = 'numbers.json'
- with open(filename) as f_obj:
- numbers = json.load(f_obj)
- print(numbers)
输出结果:
[2, 3, 5, 7, 11, 13]
对于用户生成的数据,使用json保存它们大有裨益,因为如果不以某种方式进行存储,等程序停止运行时用户的信息将丢失。
- import json
- filename='username.json'
- try:
- with open(filename) as read:
- username = json.load(read)
- except FileNotFoundError:
- username = input("What is your name? ")
- with open(filename, 'w') as write:
- json.dump(username, write)
- print("We'll remember you when you come back, " + username + "!")
-
- else:
- print("Welcome back, " + username + "!")
无论执行的是except代码块还是else代码块,都将显示用户名和合适的问候语。如果这个程序是首次运行,输出将如下:
What is your name? kangkang
We'll remember you when you come back, kangkang!
否则,输出将如下:
Welcome back, kangkang!
这是程序之前至少运行了一次时的输出。
你经常会遇到这样的情况:代码能够正确地运行,但可做进一步的改进——将代码划分为一系列完成具体工作的函数。这样的过程被称为重构。重构让代码更清晰、更易于理解、更容易扩展。
- import json
- def get_stored_username():
- """如果存储了用户名,就获取它"""
- filename = 'username.json'
- try:
- with open(filename) as f_obj:
- username = json.load(f_obj)
- except FileNotFoundError:
- return None
- else:
- return username
-
- def get_new_username():
- """提示用户输入用户名"""
- username = input("What is your name? ")
- filename = 'username.json'
- with open(filename, 'w') as f_obj:
- json.dump(username, f_obj)
- return username
-
- def greet_user():
- """问候用户,并指出其名字"""
- username = get_stored_username()
- if username:
- print("Welcome back, " + username + "!")
- else:
- username = get_new_username()
- print("We'll remember you when you come back, " + username + "!")
-
- greet_user()
第一次运行结果:
What is your name? kangkang
We'll remember you when you come back, kangkang!
否则,输出将如下:
Welcome back, kangkang!
这是程序之前至少运行了一次时的输出。
创建测试用例的语法需要一段时间才能习惯,但测试用例创建后,再添加针对函数的单元测试就很简单了。要为函数编写测试用例,可先导入模块unittest以及要测试的函数,再创建一个继承unittest.TestCase的类,并编写一系列方法对函数行为的不同方面进行测试。下面是一个只包含一个方法的测试用例,它检查函数get_formatted_name()在给定名和姓时能否正确地工作:
name_function.py
- def get_formatted_name(first, last):
- """Generate a neatly formatted full name."""
- full_name = first + ' ' + last
- return full_name.title()
test_name_ function.py
- import unittest
- from name_function import get_formatted_name
- class NamesTestCase(unittest.TestCase):
- """测试name_function.py"""
- def test_first_last_name(self):
- """能够正确地处理像Janis Joplin这样的姓名吗?"""
- formatted_name = get_formatted_name('janis', 'joplin')
- self.assertEqual(formatted_name, 'janis Joplin')
- unittest.main()
结果:
Ran 1 test in 0.000s
OK
第1行的句点表明有一个测试通过了。接下来的一行指出Python运行了一个测试,消耗的时
间不到0.000秒。最后的OK表明该测试用例中的所有单元测试都通过了。
上述输出表明,给定包含名和姓的姓名时,函数get_formatted_name()总是能正确地处理。修改get_formatted_name()后,可再次运行这个测试用例。如果它通过了,我们就知道在给定Janis Joplin这样的姓名时,这个函数依然能够正确地处理。
确定get_formatted_name()又能正确地处理简单的姓名后,我们再编写一个测试,用于测试包含中间名的姓名。为此,我们在NamesTestCase类中再添加一个方法:
name_function.py
- def get_formatted_name(first, last, middle=''):
- """生成整洁的姓名"""
- if middle:
- full_name = first + ' ' + middle + ' ' + last
- else:
- full_name = first + ' ' + last
- return full_name.title()
test_name_ function.py
- import unittest
- from name_function import get_formatted_name
- class NamesTestCase(unittest.TestCase):
- """测试name_function.py"""
- def test_first_last_name(self):
- """能够正确地处理像Janis Joplin这样的姓名吗?"""
- formatted_name = get_formatted_name('janis', 'joplin')
- self.assertEqual(formatted_name, 'Janis Joplin')
-
- def test_first_last_middle_name(self):
-
- """能够正确地处理像Wolfgang Amadeus Mozart这样的姓名吗?"""
- formatted_name = get_formatted_name('wolfgang', 'mozart', 'amadeus')
- self.assertEqual(formatted_name, 'Wolfgang Amadeus Mozart')
-
- unittest.main()
结果:
Ran 2 tests in 0.000s
OK
Python在unittest.TestCase类中提供了很多断言方法。前面说过,断言方法检查你认为应该满足的条件是否确实满足。如果该条件确实满足,你对程序行为的假设就得到了确认,你就可以确信其中没有错误。如果你认为应该满足的条件实际上并不满足,Python将引发异常。
下表描述了6个常用的断言方法。使用这些方法可核实返回的值等于或不等于预期的值、返回的值为True或False、返回的值在列表中或不在列表中。你只能在继承unittest.TestCase的类中使用这些方法。
方法 | 用途 |
assertEqual(a, b) | 核实a == b |
assertNotEqual(a, b) | 核实a != b |
assertTrue(x) | 核实x为True |
assertFalse(x) | 核实x为False |
assertIn(item, list) | 核实item在list中 |
assertNotIn(item, list) | 核实item不在list中 |
类的测试与函数的测试相似——你所做的大部分工作都是测试类中方法的行为,但存在一些不同之处,下面来编写一个类进行测试。来看一个帮助管理匿名调查的类:
survey.py
- class AnonymousSurvey():
- """收集匿名调查问卷的答案"""
- def __init__(self, question):
- """存储一个问题,并为存储答案做准备"""
- self.question = question
- self.responses = []
-
- def show_question(self):
- """显示调查问卷"""
- print(self.question)
-
- def store_response(self, new_response):
- """存储单份调查答卷"""
- self.responses.append(new_response)
- def show_results(self):
- """显示收集到的所有答卷"""
- print("Survey results:")
- for response in self.responses:
- print('- ' + response)
这个类首先存储了一个你指定的调查问题,并创建了一个空列表,用于存储答案。这个类包含打印调查问题的方法、在答案列表中添加新答案的方法以及将存储在列表中的答案都打印出来的方法。要创建这个类的实例,只需提供一个问题即可。有了表示调查的实例后,就可使用show_question()来显示其中的问题,可使用store_response()来存储答案,并使用show_results()来显示调查结果。
为证明AnonymousSurvey类能够正确地工作,我们来编写一个使用它的程序:
- from survey import AnonymousSurvey
- #定义一个问题,并创建一个表示调查的AnonymousSurvey对象
- question = "What language did you first learn to speak?"
- my_survey = AnonymousSurvey(question)
- #显示问题并存储答案
- my_survey.show_question()
- print("Enter 'q' at any time to quit.\n")
- while True:
- response = input("Language: ")
- if response == 'q':
- break
- my_survey.store_response(response)
- # 显示调查结果
- print("\nThank you to everyone who participated in the survey!")
- my_survey.show_results()
这个程序定义了一个问题("What language did you first learn to speak? "),并使用这个问题创建了一个AnonymousSurvey对象。接下来,这个程序调用show_question()来显示问题,并提示用户输入答案。收到每个答案的同时将其存储起来。用户输入所有答案(输入q要求退出)后,调用show_results()来打印调查结果:
What language did you first learn to speak?
Enter 'q' at any time to quit.
Language: english
Language: ai
Language: chaince
Language: q
Thank you to everyone who participated in the survey!
Survey results:
- english
- ai
- chaince
下面来编写一个测试,对AnonymousSurvey类的行为的一个方面进行验证:如果用户面对调查问题时只提供了一个答案,这个答案也能被妥善地存储。为此,我们将在这个答案被存储后,使用方法assertIn()来核实它包含在答案列表中:
test_survey.py
- import unittest
- from survey import AnonymousSurvey
- class TestAnonmyousSurvey(unittest.TestCase):
- """针对AnonymousSurvey类的测试"""
- def test_store_single_response(self):
- """测试单个答案会被妥善地存储"""
- question = "What language did you first learn to speak?"
- my_survey = AnonymousSurvey(question)
- my_survey.store_response('English')
- self.assertIn('English', my_survey.responses)
- unittest.main()
当我们运行test_survey.py时,测试通过了:
----------------------------------------------------------------------
Ran 1 test in 0.000s
OK
这很好,但只能收集一个答案的调查用途不大。下面来核实用户提供三个答案时,它们也将被妥善地存储。为此,我们在TestAnonymousSurvey中再添加一个方法:
- import unittest
- from survey import AnonymousSurvey
- class TestAnonmyousSurvey(unittest.TestCase):
- """针对AnonymousSurvey类的测试"""
- def test_store_single_response(self):
- """测试单个答案会被妥善地存储"""
- question = "What language did you first learn to speak?"
- my_survey = AnonymousSurvey(question)
- my_survey.store_response('English')
- self.assertIn('English', my_survey.responses)
-
- def test_store_three_responses(self):
- """测试三个答案会被妥善地存储"""
- question = "What language did you first learn to speak?"
- my_survey = AnonymousSurvey(question)
- responses = ['English', 'Spanish', 'Mandarin']
- for response in responses:
- my_survey.store_response(response)
- for response in responses:
- self.assertIn(response, my_survey.responses)
-
- unittest.main()
我们再次运行test_survey.py时,两个测试(针对单个答案的测试和针对三个答案的测试)都通过了:
----------------------------------------------------------------------
Ran 2 tests in 0.000s
OK
前述做法的效果很好,但这些测试有些重复的地方。下面使用unittest的另一项功能来提高它们的效率。
在前面的test_survey.py中,我们在每个测试方法中都创建了一个AnonymousSurvey实例,在每个方法中都创建了答案。unittest.TestCase类包含方法setUp(),让我们只需创建这些对象一次,并在每个测试方法中使用它们。如果你在TestCase类中包含了方法setUp(),Python将先运行它,再运行各个以test_打头的方法。这样,在你编写的每个测试方法中都可使用在方法setUp()中创建的对象了。
下面使用setUp()来创建一个调查对象和一组答案,供方法test_store_single_response()和test_store_three_responses()使用:
- import unittest
- from survey import AnonymousSurvey
- class TestAnonymousSurvey(unittest.TestCase):
- """针对AnonymousSurvey类的测试"""
- def setUp(self):
- """
- 创建一个调查对象和一组答案,供使用的测试方法使用
- """
- question = "What language did you first learn to speak?"
- self.my_survey = AnonymousSurvey(question)
- self.responses = ['English', 'Spanish', 'Mandarin']
-
- def test_store_single_response(self):
- """测试单个答案会被妥善地存储"""
- self.my_survey.store_response(self.responses[0])
- self.assertIn(self.responses[0], self.my_survey.responses)
-
- def test_store_three_responses(self):
- """测试三个答案会被妥善地存储"""
- for response in self.responses:
- self.my_survey.store_response(response)
- for response in self.responses:
- self.assertIn(response, self.my_survey.responses)
-
- unittest.main()
运行结果:
..
----------------------------------------------------------------------
Ran 2 tests in 0.000s
OK
注意 运行测试用例时,每完成一个单元测试,Python都打印一个字符:测试通过时打印一个句点;测试引发错误时打印一个E;测试导致断言失败时打印一个F。这就是你运行测试用例时,在输出的第一行中看到的句点和字符数量各不相同的原因。如果测试用例包含很多单元测试,需要运行很长时间,就可通过观察这些结果来获悉有多少个测试通过了。