0

0

多源局部排名数据下的全局排序算法详解与Python实践

心靈之曲

心靈之曲

发布时间:2025-08-29 16:08:01

|

937人浏览过

|

来源于php中文网

原创

多源局部排名数据下的全局排序算法详解与python实践

本文介绍了一种实用的算法,用于从多位评审员提供的、不完整且可能存在分歧的局部排名列表中,构建一个统一的全局排序列表。该方法通过为每个项目在局部列表中的位置赋予分数,然后聚合所有评审员的分数来确定项目的最终排名,有效解决了传统聚合方法难以处理的复杂场景,并提供了Python实现示例。

在许多实际应用中,我们常常需要对一系列对象进行整体排序,但获取完整且一致的排序列表并非易事。例如,在产品评估、内容审核或竞赛评选中,多位评审员可能只对部分对象进行评判,且每位评审员的排序结果可能存在差异甚至冲突。传统的排名聚合算法有时过于复杂,或不适用于这种局部、非完全重叠的排名场景。本文将详细阐述一种基于位置评分的聚合算法,旨在从这些分散且带有“噪音”的局部排名中,提炼出最具代表性的全局排序。

核心思想:基于位置的评分聚合

本算法的核心思想是为每个项目在每个局部排名列表中的位置赋予一个分数,然后将这些分数进行累加,最终根据累加的总分来确定项目的全局排名。具体来说,一个项目在局部排名中越靠前,其获得的得分就越高。通过这种方式,我们不仅考虑了项目是否被评判,更重要的是考虑了其在评判者心中的相对优劣程度。

这种方法能够有效处理以下挑战:

  1. 局部性: 评审员只对部分项目进行评判。
  2. 不一致性: 不同评审员对同一项目的看法可能不同。
  3. 噪音: 评判过程可能存在主观性和随机性。
  4. 非完全重叠: 不同的局部排名列表包含的项目集合可能大相径庭。

算法实现步骤

该算法主要分为三个关键步骤:标准化局部排名为分数、聚合所有项目的分数、以及生成全局排序列表。

立即学习Python免费学习笔记(深入)”;

步骤一:标准化局部排名为分数

首先,我们需要将每个评审员提供的局部排名列表转换为一个项目-分数对的字典。对于一个给定的局部排名列表,列表中位置越靠前的项目应获得越高的分数。

假设一个局部排名列表 ['A', 'B', 'C'],其中 'A' 是最佳,'C' 是最差。我们可以这样分配分数:

AMiner
AMiner

AMiner——新一代智能型科技情报挖掘与服务系统,能够为你提供查找论文、理解论文、分析论文、写作论文四位一体一站式服务。

下载
  • 'A':len(list) - index('A') = 3 - 0 = 3 分
  • 'B':len(list) - index('B') = 3 - 1 = 2 分
  • 'C':len(list) - index('C') = 3 - 2 = 1 分

这样,列表中第一个项目获得最高分,最后一个项目获得最低分。

def _rank_list_to_scores(rank_list):
    """
    将局部排名列表转换为基于位置的分数字典。
    列表中的第一个元素(最佳)获得最高分,最后一个元素(最差)获得最低分。

    Args:
        rank_list (list): 一个裁判的局部排名列表。

    Returns:
        dict: 项目及其对应分数的字典。
    """
    list_length = len(rank_list)
    # 使用map和lambda函数简洁地创建得分字典
    # x是列表中的元素,rank_list.index(x)是其索引
    return dict(map(lambda x: (x, list_length - rank_list.index(x)), rank_list))

# 示例:
j1_rank = ['a', 'c', 'e']
j1_rank_scores = _rank_list_to_scores(j1_rank)
# j1_rank_scores 将是 {'a': 3, 'c': 2, 'e': 1}
print(f"裁判1的评分: {j1_rank_scores}")

步骤二:聚合所有项目的分数

接下来,我们需要遍历所有待排名的项目,并累加它们从所有评审员那里获得的分数。由于每个评审员只评判了部分项目,因此在累加时需要处理项目可能未出现在某个评审员列表中的情况。

我们可以使用 collections.defaultdict(int) 来方便地进行分数累加,对于未评判的项目,其默认得分为0。

from collections import defaultdict

def _aggregate_scores(all_items, judge_score_dicts):
    """
    聚合所有项目的分数。

    Args:
        all_items (list): 包含所有待排名项目的列表。
        judge_score_dicts (list of dict): 包含所有裁判评分字典的列表。

    Returns:
        defaultdict: 每个项目及其累加总分的字典。
    """
    aggregated_scores = defaultdict(int)
    for item in all_items:
        for judge_score_dict in judge_score_dicts:
            # 如果项目不在某个裁判的评分中,则其得分为0
            aggregated_scores[item] += judge_score_dict.get(item, 0)
    return aggregated_scores

# 假设已经有了所有裁判的评分字典
# j1_rank_scores = {'a': 3, 'c': 2, 'e': 1}
# j2_rank_scores = {'b': 3, 'd': 2, 'f': 1}
# j3_rank_scores = {'a': 3, 'b': 2, 'c': 1}
# j4_rank_scores = {'d': 3, 'e': 2, 'f': 1}

# all_judge_scores = [j1_rank_scores, j2_rank_scores, j3_rank_scores, j4_rank_scores]
# aggregated_result = _aggregate_scores(['a', 'b', 'c', 'd', 'e', 'f'], all_judge_scores)
# aggregated_result 将是 {'a': 6, 'b': 5, 'c': 3, 'd': 5, 'e': 3, 'f': 2}
# print(f"聚合后的分数: {aggregated_result}")

步骤三:生成全局排序列表

最后一步是根据累加的总分对所有项目进行降序排序。得分最高的项目将排在全局列表的最前面。

def _generate_global_rank(aggregated_scores):
    """
    根据聚合分数生成最终的全局排序列表。

    Args:
        aggregated_scores (defaultdict): 每个项目及其累加总分的字典。

    Returns:
        list: 重构后的全局排序列表。
    """
    # 根据累加的得分降序排列项目,得分最高的项目排在前面。
    # sorted函数返回一个元组列表,每个元组包含(项目, 总得分)。
    # lambda item: item[1] 指定按元组的第二个元素(即得分)进行排序。
    final_ranked_items_with_scores = sorted(aggregated_scores.items(), key=lambda item: item[1], reverse=True)

    # 提取排序后的项目名称作为最终的全局排名列表
    global_ranked_list = [item[0] for item in final_ranked_items_with_scores]
    return global_ranked_list

# 假设 aggregated_scores = {'a': 6, 'b': 5, 'c': 3, 'd': 5, 'e': 3, 'f': 2}
# global_rank = _generate_global_rank(aggregated_scores)
# global_rank 将是 ['a', 'b', 'd', 'c', 'e', 'f']
# print(f"最终全局排名: {global_rank}")

完整示例代码

以下是结合上述三个步骤的完整 Python 函数和示例用法:

from collections import defaultdict

def reconstruct_global_rank(all_items, partial_ranks_by_judges):
    """
    从多个局部排名列表重构一个全局排序列表。

    Args:
        all_items (list): 包含所有待排名项目的列表。
        partial_ranks_by_judges (list of lists): 每个子列表代表一个裁判的局部排名。
                                                  列表中的顺序表示从最佳到最差。

    Returns:
        list: 重构后的全局排序列表。
    """

    # 步骤一:标准化局部排名为分数
    judge_score_dicts = []
    for rank_list in partial_ranks_by_judges:
        list_length = len(rank_list)
        score_dict = dict(map(lambda x: (x, list_length - rank_list.index(x)), rank_list))
        judge_score_dicts.append(score_dict)
    print(f"标准化后的裁判评分字典: {judge_score_dicts}")

    # 步骤二:聚合所有项目的分数
    aggregated_scores = defaultdict(int)

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

745

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

634

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

757

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

705

2023.08.11

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

25

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号