[Python] Optimizing code with numpy intersect1d, and Set

import time
import pandas as pd
import numpy as np
with open('books_published_last_two_years.txt') as f:
    recent_books = f.read().split('
')
    
with open('all_coding_books.txt') as f:
    coding_books = f.read().split('
')

start = time.time()
recent_coding_books = []

for book in recent_books:
    if book in coding_books:
        recent_coding_books.append(book)

print(len(recent_coding_books))
print('Duration: {} seconds'.format(time.time() - start))

Tip #1: Use vector operations over loops when possible

Use numpy's `intersect1d` method to get the intersection of the `recent_books` and `coding_books` arrays.

start = time.time()
recent_coding_books = np.intersect1d(recent_books, coding_books)
print(len(recent_coding_books))
print('Duration: {} seconds'.format(time.time() - start))

Tip #2: Know your data structures and which methods are faster
Use the set's `intersection` method to get the common elements in `recent_books` and `coding_books`.

start = time.time()
recent_coding_books =  set(recent_books).intersection(coding_books)
print(len(recent_coding_books))
print('Duration: {} seconds'.format(time.time() - start))

相关阅读:
计算 MD5值
CoreDate的使用
Spring入门---Spring AOP编程及示例【第一天】
Spring入门---Spring Bean的作用域【第一天】
Spring入门---示例四----集合与数组类型注入【第一天】
Spring入门---示例三总结反思---配置文件【第一天】
Spring入门---示例三，Spring IOC控制反转之依赖注入【第一天】
Spring入门---示例二，面向接口编程技术【第一天】
Spring入门---了解七个模块，以及示例一【第一天】
eclipse局域网项目部署(纯感想)

原文地址：https://www.cnblogs.com/Answer1215/p/12943433.html