MongoDB游标超时问题的4种解决方法

数据库 2024/12/28 佚名

3 1 2

快活林资源网 Design By www.csstdc.com

当我们使用Python从MongoDB里面读取数据时，可能会这样写代码：

import pymongo

handler = pymongo.MongoClient().db.col

for row in handler.find():
 parse_data(row)

短短4行代码，读取MongoDB里面的每一行数据，然后传入parse_data做处理。处理完成以后再读取下一行。逻辑清晰而简单，能有什么问题？只要parse_data(row)不报错，这一段代码就完美无缺。

但事实并非这样。

你的代码可能会在for row in handler.find()这一行报错。它的原因，说来话长。

要解释这个问题，我们首先就需要知道，handler.find()返回的并不是数据库里面的数据，而是一个游标（cursor）对象。如下图所示：

只有当你使用for循环开始迭代它的时候，游标才会真正去数据库里面读取数据。

但是，如果每一次循环都连接数据库，那么网络连接会浪费大量时间。

所以pymongo会一次性获取100行，for row in handler.find()循环第一次的时候，它会连上MongoDB，读取一百条数据，缓存到内存中。于是第2-100次循环，数据都是直接从内存里面获取，不会再连接数据库。

当循环进行到底101次的时候，再一次连接数据库，再读取第101-200行内容……

这个逻辑非常有效地降低了网络I/O耗时。

但是，MongoDB默认游标的超时时间是10分钟。10分钟之内，必需再次连接MongoDB读取内容刷新游标时间，否则，就会导

致游标超时报错：

pymongo.errors.CursorNotFound: cursor id 211526444773 not found

如下图所示：

所以，回到最开始的代码中来，如果parse_data每次执行的时间超过6秒钟，那么它执行100次的时间就会超过10分钟。此时，当程序想读取第101行数据的时候，程序就会报错。

为了解决这个问题，我们有4种办法：

修改MongoDB的配置，延长游标超时时间，并重启MongoDB。由于生产环境的MongoDB不能随便重启，所以这个方案虽然有用，但是排除。
一次性把数据全部读取下来，再做处理：

all_data = [row for row in handler.find()]

for row in all_data:
 parse(row)

这种方案的弊端也很明显，如果数据量非常大，你不一定能全部放到内存里面。即使能够全部放到内存中，但是列表推导式遍历了所有数据，紧接着for循环又遍历一次，浪费时间。

3.让游标每次返回的数据小于100条，这样消费完这一批数据的时间就会小于10分钟：

# 每次连接数据库，只返回50行数据
for row in handler.find().batch_size(50): 
 parse_data(row)

但这种方案会增加数据库的连接次数，从而增加I/O耗时。

4.让游标永不超时。通过设定参数no_cursor_timeout=True，让游标永不超时：

cursor = handler.find(no_cursor_timeout=True)
for row in cursor:
 parse_data(row)
cursor.close() # 一定要手动关闭游标

然而这个操作非常危险，因为如果你的Python程序因为某种原因意外停止了，这个游标就再也无法关闭了！除非重启MongoDB，否则这些游标会一直留在MongoDB上，占用资源。

当然可能有人会说，使用try...except把读取数据的地方包住，只要抛出了异常，在处理异常的时候关闭游标即可：

cursor = handler.find(no_cursor_timeout=True)
try:
 for row in cursor:
 parse_data(row)
except Exception:
 parse_exception()
finally:
 cursor.close() # 一定要手动关闭游标

其中finally里面的代码，无论有没有异常，都会执行。

但这样写会让代码非常难看。为了解决这个问题，我们可以使用游标的上下文管理器：

with handler.find(no_cursor_timeout=True) as cursor:
 for row in cursor:
  parse_data(row)

只要程序退出了with的缩进，游标自动就会关闭。如果程序中途报错，游标也会关闭。

它的原理可以用下面两段代码来解释：

class Test:
 def __init__(self):
  self.x = 1

 def echo(self):
  print(self.x)

 def __enter__(self):
  print('进入上下文')
  return self

 def __exit__(self, *args):
  print('退出上下文')
  
with Test() as t:
 t.echo()
print('退出缩进')

运行效果如下图所示：

接下来在with的缩进里面人为制造异常：

class Test:
 def __init__(self):
  self.x = 1

 def echo(self):
  print(self.x)

 def __enter__(self):
  print('进入上下文')
  return self

 def __exit__(self, *args):
  print('退出上下文')
  
with Test() as t:
 t.echo()
 1 + 'a' # 这里一定会报错
print('退出缩进')

运行效果如下图所示：

无论在with的缩进里面发生了什么，Test这个类中的__exit__里面的代码始终都会运行。

我们来看看pymongo的游标对象里面，__exit__是怎么写的，如下图所示：

可以看到，这里正是关闭游标的操作。

因此，如果我们使用上下文管理器，就可以放心大胆地使用no_cursor_timeout=True参数了。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对的支持。

mongodb游标超时,mongodb,游标

快活林资源网 Design By www.csstdc.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

快活林资源网 Design By www.csstdc.com

评论“MongoDB游标超时问题的4种解决方法”

暂无评论...

www.csstdc.com 快活林资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

最新文章

《三国志8重置版》劝降机制介绍

2024/12/28

《欢欣森活》最新官方配置要求一览

2024/12/28

《欢欣森活》存档方法

2024/12/28

《炉石传说》2024新赛季上线更新内容问题汇

2024/12/28

《南瓜恐慌》进不去游戏解决方法

2024/12/28

《战舰世界》语音包文件夹位置介绍

2024/12/28

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/12/28

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

MongoDB游标超时问题的4种解决方法

MongoDB中的定时索引示例详解

基于Morphia实现MongoDB按小时、按天聚合操作方法

评论“MongoDB游标超时问题的4种解决方法”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

MongoDB游标超时问题的4种解决方法

MongoDB中的定时索引示例详解

基于Morphia实现MongoDB按小时、按天聚合操作方法

评论“MongoDB游标超时问题的4种解决方法”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存