十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營(yíng)維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
這篇文章將為大家詳細(xì)講解有關(guān)python中如何解決內(nèi)存泄漏問題,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
其實(shí)這次主要是在使用aiohttp寫一個(gè)接口的時(shí)候出現(xiàn)的問題,其實(shí)復(fù)現(xiàn)出問題非常容易,我們實(shí)現(xiàn)一個(gè)簡(jiǎn)單的接受post請(qǐng)求接口的服務(wù)端,然后實(shí)現(xiàn)一個(gè)并發(fā)的客戶端來訪問這個(gè)接口,來查看內(nèi)存的情況
注意: 這個(gè)問題是在一個(gè)包的特定版本出現(xiàn)的:multidict==4.5.1,
我在整理這個(gè)文章2個(gè)小時(shí)前作者已經(jīng)修復(fù)了這個(gè)問題發(fā)布了4.5.2版本,已經(jīng)修復(fù)了內(nèi)存的問題,并且我也進(jìn)行了測(cè)試驗(yàn)證
服務(wù)端代碼:
from aiohttp import web async def hello(request): return web.json_response(await request.json()) app = web.Application() app.add_routes([web.post('/', hello)]) web.run_app(app)
客戶端代碼:
import asyncio import aiohttp async def foo(times): data = {'foo': 1} async with aiohttp.ClientSession() as session: for x in range(times): resp = await session.post('http://localhost:8080', json=data) if not x % 100: print(await resp.json()) loop = asyncio.get_event_loop() loop.run_until_complete(foo(100000)) loop.close()
因?yàn)槲业拇a是在linux上跑的,或者mac上我們都可以通過htop非常方面的實(shí)時(shí)查看我們程序內(nèi)存的占用情況,我們先將服務(wù)端啟動(dòng),查看一下我們此時(shí)的內(nèi)存情況可以看到占用的
非常少,當(dāng)我們打開客戶端之后,再次觀察我們可以看到內(nèi)存不斷增長(zhǎng),及時(shí)我們客戶端運(yùn)行完畢內(nèi)存也不會(huì)降低。
當(dāng)客戶端結(jié)束之后的內(nèi)存:
如果客戶端不停止的話內(nèi)存會(huì)一直漲,最后的結(jié)果就是把你的系統(tǒng)內(nèi)存吃完,然后被系統(tǒng)殺掉你的進(jìn)程。
像上面的例子是一個(gè)非常簡(jiǎn)單的程序,不復(fù)雜我們也并沒有做上面復(fù)雜的操作就是一個(gè)簡(jiǎn)單的接受post請(qǐng)求的服務(wù)端,但是如果是在實(shí)際的項(xiàng)目中我們可能會(huì)寫非常復(fù)雜的業(yè)務(wù)邏輯,那到時(shí)候我們又如何找到是哪里導(dǎo)致的內(nèi)存問題,當(dāng)我碰到這個(gè)問題的時(shí)候,其實(shí)我和很多接觸python不久的人差不多,也是不知道怎么查這種問題,各種百度各種查,也找到了好多推薦的工具,memory_profiler庫,objgraph庫,graphviz工具,但是都沒有幫助我迅速的找到問題點(diǎn)在哪里,最后看到標(biāo)準(zhǔn)庫中的tracemalloc,地址:https://docs.python.org/3/library/tracemalloc.html
通過這個(gè)包很快幫我找到了內(nèi)存泄漏的地方
接下來按照官網(wǎng)的方法我將代碼進(jìn)行改寫,來測(cè)試到底哪里的問題導(dǎo)致的內(nèi)存泄漏,更改后的服務(wù)端代碼為:
from aiohttp import web import tracemalloc async def hello(request): return web.json_response(await request.json()) async def get_info(request): snapshot2 = tracemalloc.take_snapshot() top_stats = snapshot2.compare_to(snapshot1, 'lineno') print(top_stats) return web.Response(text="ok") if __name__ == '__main__': app = web.Application() app.add_routes( [ web.post('/', hello), web.get("/get_info", get_info) ] ) tracemalloc.start() snapshot1 = tracemalloc.take_snapshot() web.run_app(app)
注意print(top_stats)這行打印的結(jié)果最后要關(guān)注
其實(shí)這里就是新增加了一個(gè)路由get_info, 我們啟動(dòng)服務(wù)端之后開啟客戶端,當(dāng)我們客戶端運(yùn)行完畢之后,可以看到內(nèi)存已經(jīng)漲上去了,并且沒有不會(huì)釋放,這個(gè)時(shí)候,可以直接通過瀏覽器訪問get_info這個(gè)路由看看print打印的內(nèi)容,這里將會(huì)打印出你程序運(yùn)行到這個(gè)時(shí)候那一行的代碼內(nèi)存增長(zhǎng)的比較多,進(jìn)行一次排序,前面的幾個(gè)其實(shí)都是需要你關(guān)注的,因?yàn)檫@里數(shù)據(jù)較多,我就只打印如下前幾個(gè)數(shù)據(jù)
,)> size=116500672 (+116500672) count=300004 (+300004)>, ,)> size=11400000 (+11400000) count=200000 (+200000)>, ,)> size=8000000 (+8000000) count=100000 (+100000)>, ,)> size=5500000 (+5500000) count=100000 (+100000)>, ,)> size=5300608 (+5300608) count=100001 (+100001)>,
我們拿第一行來說,我們可以非常清楚的指導(dǎo)web_response的56行代碼導(dǎo)致內(nèi)存增長(zhǎng)的最多,當(dāng)然如果是我們復(fù)雜的項(xiàng)目也可以通過類似的方法,這樣就可以非常快捷的找到我們代碼中哪些地方會(huì)造成內(nèi)存溢出,便于排查問題,我們點(diǎn)進(jìn)去看看這行代碼:
我們找到最終行,這個(gè)時(shí)候我們大致就可以看出哪里的問題了,我們接著看 CIMultiDict
class CIMultiDict(MultiDict): def _title(self, key): return key.title()
我們可以看到這個(gè)它繼承 MultiDict 其實(shí)這里我們已經(jīng)應(yīng)該知道問題就是處在這個(gè)MultiDict上了
而這個(gè)最終其實(shí)最終就是MultiDict這個(gè)包,問題出在了這個(gè)包上,這個(gè)項(xiàng)目是在這里維護(hù)的:https://github.com/aio-libs/multidict
查看這個(gè)包的時(shí)候看到了,果然有人和我遇到了同樣的問題,問題就是出在這里了,已經(jīng)有人提交了bug
https://github.com/aio-libs/multidict/issues/307
不過不得不說國(guó)外的程序員真的是熱愛自己的職業(yè),很快這個(gè)問題得到了aio-libs小組中人的回應(yīng),問題也在我整理這個(gè)博客的時(shí)候被修復(fù)了,在最新的版本:4.5.2中已經(jīng)測(cè)試沒有內(nèi)存泄漏的問題
關(guān)于“python中如何解決內(nèi)存泄漏問題”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。