python两个数组相同个数_python–快速算法,用于查多个数组具有相同值...--688IT编程网

python两个数组相同个数_python–快速算法,⽤于查多个数

组具有相同值的索引...

最终破解了它的⽮量化解决⽅案！这是⼀个有趣的问题.问题是我们必须标记从列表的相应数组元素中获取的每对值.然后，我们应该根据它们在其他对中的唯⼀性来标记每个这样的对.因此，我们可以使⽤np.unique滥⽤所有可选参数，最后做⼀些额外的⼯作来保持最终输出的顺序.这⾥的实施基本上分三个阶段完成 –

# Stack as a 2D array with each pair from values as a column each.

# Convert to linear index equivalent considering each column as indexing tuple

arr = np.vstack(values)

idx = np.ravel_multi_index(arr,arr.max(1)+1)

# Do the heavy work with np.unique to give us :

# 1. Starting indices of unique elems,

# 2. Srray that has unique IDs for each element in idx, and

# 3. Group ID counts

_,unq_start_idx,unqID,count = np.unique(idx,return_index=True, \

return_inverse=True,return_counts=True)

# Best part happens here : Use mask to ignore the repeated elems and re-tag

# each unqID using argsort() of masked elements from idx

mask = ~np.in1d(unqID,np.where(count>1)[0])

mask[unq_start_idx] = 1

out = idx[mask].argsort()[unqID]

运⾏时测试

让我们将提出的⽮量化⽅法与原始代码进⾏⽐较.由于建议的代码仅为我们提供了组ID，因此对于公平的基准测试，我们只需从原始代码中删除不⽤于提供给我们的部分.那么，这是函数定义 –

def groupify(values): # Original code

group = np.zeros((len(values[0]),), dtype=np.int64) - 1

next_hash = 0

matching = np.ones((len(values[0]),), dtype=bool)

while any(group == -1):

matching[:] = (group == -1)

first_ungrouped_idx = np.where(matching)[0][0]

for curr_id, value_array in enumerate(values):

needed_value = value_array[first_ungrouped_idx]

python 定义数组matching[matching] = value_array[matching] == needed_value

# Assign all of the found elements to a new group

group[matching] = next_hash

next_hash += 1

return group

def groupify_vectorized(values): # Proposed code

arr = np.vstack(values)

idx = np.ravel_multi_index(arr,arr.max(1)+1)

_,unq_start_idx,unqID,count = np.unique(idx,return_index=True, \ return_inverse=True,return_counts=True)

mask = ~np.in1d(unqID,np.where(count>1)[0])

mask[unq_start_idx] = 1

return idx[mask].argsort()[unqID]

运⾏时结果列表包含⼤型数组 –

In [345]: # Input list with random elements

...: values = [item for item in np.random.randint(10,40,(10,10000))] In [346]: np.allclose(groupify(values),groupify_vectorized(values)) Out[346]: True

In [347]: %timeit groupify(values)

1 loops, best of 3: 4.0

2 s per loop

In [348]: %timeit groupify_vectorized(values)

100 loops, best of 3: 3.74 ms per loop

688IT编程网

python两个数组相同个数_python–快速算法,用于查多个数组具有相同值...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python两个数组相同个数_python–快速算法,用于查多个数组具有相同值...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式