UQI-LIUWJ

论文笔记：CellSense: Human Mobility Recovery via Cellular Network Data Enhancement

1 intro

1.1 背景

1.1.1 蜂窝计费记录（CBR）

人类移动性在蜂窝网络上的研究近些年得到了显著关注，这主要是因为手机的高渗透率和收集手机数据的边际成本低
蜂窝服务提供商收集蜂窝计费记录（CBR）用于计费目的，例如电话、短信和互联网访问
- 这些记录可以被重新利用来感知用户的位置
- 与仅涉及用户电话和短信通话记录的通话详单记录（CDR）相比，CBR是一个更通用的数据集
依靠网络运营商收集的各种CBR数据集，研究人员广泛研究了人类移动性感知
- 集体移动性，如流量和旅行时间
- 个人移动性，如通勤模式和用户空间画像
  - 这些都是基于统计方法的，例如隐马尔可夫模型或条件随机场

文章	地址	天数	大小
Human Mobility Modeling at Metropolitan Scales (MobiSys ’12)	NY & LA	91	585K users
Identifying important places in people’s lives from cellular network data. In International Conference on Pervasive Computing. 2011	NY & LA	78	168K users
Ranges of human mobility in Los Angeles and New York 2011	NY & LA	140	352K users
Dp-where: Differentially private modeling of human mobility. In 2013 IEEE international conference on big data 2013	New York	91	250K users
Identifying user habits through data mining on call data records. Engineering Applications of Artificial Intelligence 54 (2016),	Ivory Coast	150	50K users
Urban computing using call detail records: mobility pattern mining, next-location prediction and location recommendation. Ph.D. Dissertation. 2016	China	—	100K users
Human Habits Investigation: from Mobility Reconstruction to Mobile Traffic Prediction. Ph.D. Dissertation. 2018	Shanghai	14	642K users
Activity-based human mobility patterns inferred from mobile phone data: A case study of Singapore. IEEE Transactions on Big Data 3, 2 (2017)	Singapore	14	3.17M users
CellTrans: Private Car or Public Transportation? Infer Users’ Main Transportation Modes at Urban Scale with Cellular Data. Proc. ACM Interact. Mob. Wearable Ubiquitous Technol. 3, 3, Article 125 (Sept. 2019),	Shenyang & Dalian	48	3M users
Estimating travel time of Dhaka city from mobile phone call detail records. In Proceedings of the Ninth International Conference on Information and Communication Technologies and Development. 2017	Dhaka City	30	2.87M users
Clustering weekly patterns of human mobility through mobile phone data. IEEE Transactions on Mobile Computing 17, 4 (2017)	Paris	21	800M records
MultiCell: Urban Population Modeling Based on Multiple Cellphone Networks. Proc. ACM Interact. Mob. Wearable Ubiquitous Technol. 2, 3, Article 106 (Sept. 2018)	Shenzhen	—	10.2M records
Mobile edge computing-based data-driven deep learning framework for anomaly detection. IEEE Access 7 (2019)	Milan	60	319M records
Learning Behavioral Representations of Human Mobility 2020	Italy	67	17K trajectories

Table 1. Related Work Using Cellphone Billing Records (CBR) Name Location # Days Volume

1.1.2 CBR+机器学习的挑战

近期机器学习的进步，特别是深度学习，有潜力进一步提高人类移动性建模的准确性
- 然而，使用蜂窝网络数据进行机器学习模型的挑战在于用户的CBR（蜂窝计费记录）在时间维度上通常过于稀疏
- 这是因为这些CBR数据主要是为计费目的而收集的，例如电话、短信和互联网访问，但大多数人每天有长时间没有任何CBR数据，因为没有活动
——>设计一个恢复模型，来推断个别用户原始CBR数据间隙中历史遗漏的观测数据，以获得密集的CBR数据，来训练预测性的机器学习模型

1.1.3 现有工作对CBR稀疏性的解决

一些工作结合CBR数据和其他移动性数据源，例如交通数据，采用共训练或多视图学习等方法
- 这类研究需要额外的数据源进行校准，这些数据源并不总是其他拥有CBR数据的研究者能够获取的
从蜂窝塔进行地图匹配，例如ctrack、coSense
- 通过与蜂窝塔的连接实现连续的位置感知
- 结合附近塔的蜂窝信号强度分布和CDR数据进行位置定位
- 这些工作需要专门的数据收集，例如连续的主动手机连接或手机内部传感器数据

1.1.4 CBR 恢复的挑战

感知数据不足和不规则的蜂窝使用模式，个体移动性存在不确定性
几乎不可能用外部数据源（如交通数据）来校准不确定性
- 由于加密，用户在不同数据集中有不同的匿名ID
- ——>个体级别的细粒度移动性很难与不同数据源的数据融合匹配

1.2 论文的关键技术

论文的的恢复方法构建了两个关键技术
- 单一数据源中的个体移动性校准
  - 提取集体移动性特征（例如，基于所有用户的CBR数据的旅行时间）
  - 应用这些集体移动性特征作为个体移动性推断中的校准因素，以解决个体CBR数据中的不确定性
- 阶段性双向学习
  - 对于个体用户，不仅仅关注单个记录，而是将用户分为观察和未观察阶段的分阶段分布
  - 基于观察阶段的连续记录，我们推断用户状态，例如交通方式
为了严格评估论文的恢复模型，论文使用合肥的信令数据
- 这些信令数据记录了手机和蜂窝塔之间的互动，例如连接、断开、寻呼等，即使没有计费活动
- 这些信令数据作为ground-truth

1.3 问题定义

在没有访问其他数据源的情况下恢复CBR中丢失的记录以提高数据质量
- ——>设计并实施了一个名为CellSense的人类移动性恢复系统，它有两个关键组成部分：
  - 一个与个体无关的集体移动性建模组件
  - 一个与个体有关的情境感知个体移动性建模组件

1.4 挑战

1.4.1 新地点

尽管人类移动性显示出规律性模式，例如家与工作地点之间的通勤，但人类移动性仍存在不确定性
利用两周的CBR（蜂窝计费记录）数据分析用户访问的地点，然后研究用户在下一周新地点的不规则性
- 发现只有37.1%的用户在已有地点间移动，约23.2%的用户访问了超过8个新地点
- 由于缺乏历史观测数据，新地点为人类移动性恢复带来挑战。

1.4.2 感知粒度

与GPS设备等传感器不同，后者以固定时间间隔被动感知人类位置（例如，每5秒），手机设备依赖于用户活动来进行位置感知，蜂窝计费记录的时间感知粒度是不均匀的
——>两个CBR记录之间的平均感知粒度，即时间间隔，因用户不同的手机使用模式而异
如图1b所示，在26.3%的用户中，两个CBR记录之间的平均时间间隔不到1分钟，而在顶部26.4%（100%-73.6%）的用户中超过10分钟
- ——>非均匀和不规则的感知粒度为人类移动性恢复带来了新的挑战

2 数据集

2.1 合肥蜂窝计费记录（CBR）

每个CBR记录有5个属性
表2给出了一个样本记录和一些统计信息

对CBR进行了初步的空间和时间分布分析
- 在空间维度上，应用Voronoi划分来估计蜂窝塔的空间覆盖范围
  - 发现市中心的用户密度比周边郊区高
  - 进一步进行定量分析
    - 塔上的记录分布不均衡。80%的记录集中在30%的蜂窝塔上，这些塔主要位于城市的市中心区域
- 在时间维度上
  - 在8:00、13:00和22:00有三个使用高峰，分别对应用户的早高峰、午餐时间和晚高峰

2.2.用户上下文信息

论文还获得了对从订阅数据和蜂窝运营商元数据中收集的用户上下文数据的访问权限
- 【IT公司与蜂窝运营商合作，为特定应用或服务提供专门的蜂窝数据套餐】
- ——>可以间接地提供更多关于用户行为的信息
CBR数据中的所有订阅蜂窝用户都有标签
- 大约80%的用户拥有不到5个标签，单个用户的最大标签数量为37个，所有用户的平均标签数量为4个
- - 第一列显示类别；
  - 第二列表示此类别的相应标签占所有标签的百分比
  - 最后一列展示拥有此类别标签的用户百分比占所有用户的百分比
对于手机使用类别，典型的标签包括视频、音乐等
对于与汽车相关的类别，典型标签包括与汽车相关的属性
对于人口统计类别，典型标签包括性别、年龄范围
对于服务类别，典型标签与生活中的服务相关

2.3 路网

合肥市的道路网络数据来自OpenStreetMap，包括49,603条道路段，总长12,813公里
道路网络分布与图2中的用户密度相一致，即在道路段较密集的地方发现了更多用户

2.4 人口

根据Worldpop项目收集的人口普查数据在图4中可视化了人口分布
与道路网络分布类似，用户密度分布与人口分布之间存在高度相关性

3 模型

3.1 系统概览

两个模块来应对1.4中提到的“新地点”、‘感知粒度不均“这两个挑战
- 独立于个体的集体移动性建模组件
- 依赖于个体的、具有上下文感知的个体移动性建模组件

3.2 初步研究

3.2.1 空间和时间粒度

空间
- 使用Voronoi划分来估计蜂窝塔的覆盖范围[
- 假设用户连接到最近的塔
时间
- 将时间分为5分钟的时间段
- 如果用户在同一时间段内连接到多个塔，我们将时间段内的位置设置为频率最高的塔

3.2.2 移动性图构建

移动性图定义为 = ( , )，其中是塔位置，是连接蜂窝塔的边的集合

3.2.3 Ping-Pong效应和异常值

记录中存在异常值和噪声，这是由多种因素引起的
- 负载平衡
- Ping-Pong效应

通过速度来识别异常记录
- 对于用户，我们按时间对其记录进行排序，然后计算每对相邻记录和+1的行驶速度→(+1)
- 计算速度的均值和方差
- 对于一段时间内的所有行驶速度→(+1)，∀ ，通过 $z=\frac{|s_{i \rightarrow (i+1)}-\bar{x}|}{\sigma}$ 计算速度的z分数
- 在z分数低于阈值时移除+1

3.2.4 停留点（staypoint）检测和行程分割

停留点是用户在一定时间内停留的位置
- 这些位置通常是空间画像的重要兴趣点（PoI），如家庭和工作地点
根据行驶速度和时间来识别停留点，例如，在一定时间内行驶速度为0
基于停留点，将用户记录分割成一段一段行程
如果行程的起点和终点是同一个停留点，将此行程期间所有用户缺失的位置标记为停留点

3.2.5 观察和未观察阶段

蜂窝用户在旅行期间会在短暂的连续时间内使用蜂窝服务，然后断开一段时间
- 例如，用户在公交车上可能会检查电子邮件或与朋友发送即时消息。在这段时间内，用户的位置在蜂窝网络中是可观察的。当没有与附近塔建立蜂窝连接时，用户的位置变得不可见
——>将用户轨迹分为两个阶段，即有蜂窝活动的观察阶段和没有蜂窝活动的未观察阶段
目标是推断未观察阶段中用户在特定时间的位置

3.3 集体移动性建模

3.3.1 目标

为了推断未观察阶段中缺失的记录，估计用户在未观察阶段的旅行时间和路线至关重要
然而，个体用户观察到的记录数量有限。在移动性图上，许多边缺乏用户的观测
——>首先估计不同交通方式下的平均旅行时间，然后将平均旅行时间与个体特征结合起来（个体特征是下一小节的内容）

3.3.2 设计

对于有直接观测的边，旅行时间可以通过统计平均值直接估计
对于观测稀疏的边，由于缺乏直接观测，即使用户在未观察阶段中经过这些边，旅行时间估计也是具有挑战性的
——>需要从直接观测（观察阶段）和间接观测（未观察阶段）中推断旅行时间

任何旅行的总旅行时间τ可以用以下公式表示
- - = (1, 2, ..., , ..., )，是边上的旅行时间
  - = (1, 2, ..., , ..., )是路线指标，其中=1表示用户通过边，否则=0
  - 【用户经过了多少条边，就把这几条边上的时间相加】
- 对于观察阶段，边上的旅行时间可以直接从用户观测中推断
- 于未观察阶段，只知道总旅行时间，这可以通过之前和之后观测值的时间差推断

采用两个步骤来估计未观察阶段的旅行时间

路线推断
边旅行时间推断

3.3.3 路线推断

基于距离和旅行时间约束，在移动性图上推断用户的详细移动路线
理论上，移动性图上两个位置之间有无限多条路线
- 为了避免额外的计算成本并使问题可行，论文只关注非返回旅行路线，即用户不会两次通过同一边
- 论文从用户的观察阶段验证了这一假设，并发现大约98.3%的行程在一次旅行中不包括重复边
应用深度优先搜索（DFS）算法在未观察阶段前后两个观察位置之间搜索可能的路线候选NTU 课程： MAS714（3） DFS & BFS（搜索算法）-CSDN博客
- 为每次搜索设置一个访问指示器，并剪除所有返回路线
- 发现82.6%未观察阶段的旅行距离小于2公里
- 为了进一步减少路线候选数量并识别用户的实际旅行路线，应用几个启发式因素来剪除路线候选
  - 旅行速度应在合理范围内，例如市区小于80公里每小时，郊区小于150公里每小时
    - 【这里我感觉是总旅行距离/旅行时间】
  - 旅行距离应小于一定阈值，例如最短距离的两倍
  - 通过这两种剪枝方法，79.3%未观察阶段的路线候选数量小于3。

3.3.4 边旅行时间推断

在未观察阶段，对于方程1（ $\tau=X^TP$ ），总旅行时间和旅行路线已通过路线候选搜索和剪枝得知
但是，每一条边的边旅行时间仍未知
为了估计旅行时间，我们用隐藏参数（对于一个边和一个交通方式，参数包括对应高斯分布的均值和方差）表示边旅行时间
- 目标是估计一组参数，使得在方程1中的似然估计最大化
- ——>应用了EM（期望最大化）算法
  - 首先，从有直接观测的周围边初始化参数集
  - 其次，用迭代EM算法的两个步骤更新边的旅行时间
    - 在E步骤中，根据当前边旅行时间分布，从CBR路线的每个边生成样本
      - 每个样本包含两个元素，旅行时间和在分布中的相应概率
    - 在M步骤中，我们用新样本更新边的参数

【我们想要找到最佳的旅行时间分布参数（每个边的平均旅行时间和方差），使得观测到的总旅行时间（）出现的概率最大】

这些分布是某个路段、某种出行方式的速度，不取决于某一个用户，可以根据不同用户的移动数据不断进行调整和更新

3.4 个体mobility 建模

3.4.1 全局信息模块

全局信息模块融合了来自集体移动性建模的估计旅行时间、人口分布和移动性图、
- 城市中的人类移动性与人口分布高度相关，例如，在人口密度高的地区有较高的旅行需求
- 尽管可以从蜂窝网络数据模拟人口分布，但先前的工作表明单个网络的用户分布可能存在偏差，不能准确反映真实的人口分布
- 因此，论文使用独立的基于人口普查的数据源来获取人口分布信息
- 移动性图和旅行时间是基于集体移动性建模创建和估计的
由于人口和移动性图是静态信息，在短时间内不会改变，我们对这两个数据集进行空间映射
- 将城市划分为小的Voronoi区域，然后计算每个区域的移动性图和人口密度
旅行时间随时间和地点动态变化，因此同时应用空间和时间映射
- 在一天中不同时间段计算Voronoi区域内的平均旅行时间

3.4.2 上下文信息嵌入。

上下文信息包括用户的人口统计因素
这些因素的影响在用户之间是不同的
- eg，如果用户住在郊区，与居住在公共交通覆盖更密集的市中心地区的用户相比，他们为了通勤目的使用汽车的频率将更高
为了捕捉这些隐藏的相关性差异，论文采用了注意力机制来自动学习因素的权重

3.4.3 双向移动性学习

使用双向GRU
- 将移动性图、图上的旅行时间和个人上下文信息与位置估计整合起来
通常，由于未观察阶段的距离和时间较小，不足以改变交通方式，用户在未观察阶段会保持上一个观察阶段的同一交通方式
- 为了利用先验信息并在训练过程中动态更新用户模式，在训练过程中采用了多任务学习机
- 应用编码器层来嵌入个人移动记录和交通方式
- 解码器层解码嵌入的位置和交通方式

4 实验

4.1 数据

信令数据作为真实数据
- 信令数据捕获信号切换活动
- 空间覆盖率和CBR相同，但是时间覆盖率远大于CBR
  - 80%的信令记录更新间隔小于80秒
  - 80%的CBR用户的更新间隔小于13分钟

4.2 结果

yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量 ICCL 2022 365JHWZGo 情感对话论文阅读 gpt-3 共情回复上下文学习提示学习大模型
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量ICCL2022前言贡献PromptIn-contextlearningSITSMEMOSITSM新的自动指标实验前言亲身阅读感受分享，细节画图解释，再也不用担心看不懂论文啦~无抄袭，无复制，纯手工敲击键盘~今天为大家带来的是《DoesGPT-3GenerateEmpatheticDialogues
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
论文笔记＜交通灯＞＜多智能体＞CoLight管理交通灯青椒大仙KI11 论文阅读
今天看的是论文Colight:学习网络级合作进行交通信号控制论文提出的CoLight模型是一种基于强化学习和图注意力网络的交通信号灯控制方法，旨在解决城市道路网络中的交通信号的写作问题，提升车辆通行效率。问题定义为：将交通信号控制问题建模为马尔可夫博弈，每个路口由一个智能体控制，智能体通过观察部分系统状态（当前相位和各车道车辆数），选择动作（下一时间段的相位），目标是最小化路口周围车道的平均队列长
《基于超声的深度学习模型用于降低BI-RADS 4A乳腺病变的恶性率》论文笔记 MobileNet 往事随风、、论文笔记机器学习深度学习论文阅读人工智能机器学习健康医疗
《APPLICATIONOFDEEPLEARNINGTOREDUCETHERATEOFMALIGNANCYAMONGBI-RADS4ABREASTLESIONSBASEDONULTRASONOGRAPHY》《基于超声的深度学习模型用于降低BI-RADS4A乳腺病变的恶性率》原文地址：链接文章目录摘要简介方法患者图像获取与处理深度学习模型统计分析结果讨论结论摘要本研究旨在开发一个基于超声（US）图像
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文阅读：arxiv 2025 OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation CSPhD-winston-杨帆论文阅读
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://www.doubao.com/chat/8815924393371650https://arxiv.org/pdf/2506.02397#page=17.09OThink文章目录速览研究背景与问题核心思路与方法实验结果结论与意义速览这篇论文聚焦于
论文阅读：arxiv 2025 Not All Tokens Are What You Need In Thinking
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://arxiv.org/pdf/2505.17827https://www.doubao.com/chat/8814790364572162文章目录速览研究背景提出的解决方案：条件token选择（CTS）实验结果核心贡献研究局限总结速览这篇论文主要探
[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers 颜笑晏晏论文阅读
1.摘要双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而，低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没，即本文中的超调(overshoot)，这限制了现有两个分支模型的准确性的提高。在本文中，我们在卷积神经网络（CNN）和比例积分微分（PID）控制器之间架起了桥梁，并揭示了双分支网络只是一个比例积分（PI）控制器，当然也会存在类似的超调问题。为了解决这个问题，
[论文阅读] 人工智能+软件工程 | 用 LLM + 静态代码分析自动化提升代码质量张较瘦_ 前沿技术论文阅读人工智能软件工程
用LLM+静态代码分析自动化提升代码质量论文信息AugmentingLargeLanguageModelswithStaticCodeAnalysisforAutomatedCodeQualityImprovements@article{abtahi2025augmenting,title={AugmentingLargeLanguageModelswithStaticCodeAnalysisfo
论文笔记--Language Models are Unsupervised Multitask Learners Isawany 论文阅读论文阅读语言模型 transformer chatgpt 自然语言处理
论文笔记GPT-2--LanguageModelsareUnsupervisedMultitaskLearners1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1数据集WebText2.2.2分词方法3.GPT-1&GPT-24.文章亮点5.原文传送门6.References1.文章简介标题：LanguageModelsareUnsupervisedMultitaskLearners
You Only Look Once Unified, Real-Time Object Detection论文笔记 __Lo__ 目标检测论文阅读深度学习
文章结构统一检测框架(UnifiledDetection)核心思想YOLO将目标检测视为一个端到端的回归问题，输入的图像经过SingleForwardPass，直接输出物体的信息（边界框的位置、边界框的置信度、类别概率）；优势在于速度快，全局理解上下文，这里全局理解上下文的意思是识别物体和背景的关系，减少误检。网络设计网格划分（GridDivision）将图像划分为一个S×S的网格，文中S=7；共
经典论文阅读《A Framework for Unifying Reordering Transformations》《统一重排序变换的框架》好好学习啊天天向上自动性能优化
1）摘要我们提出了一个用于统一迭代重排序变换的框架，这些变换包括循环交换、循环分布、倾斜、分块、索引集拆分和语句重排序。该框架基于这样一种思想：变换可以表示为将原始迭代空间映射到新迭代空间的调度。框架旨在为变换提供一种统一的表示和推理方式。作为框架的一部分，我们提供了辅助构建和使用调度的算法，特别是用于检验调度合法性、对齐调度以及为调度生成优化代码的算法。2）优化编译器会对语句的迭代进行重新排序，
[论文阅读] 系统架构 | 零售 IT 中的微服务与实时处理：开源工具链与部署策略综述张较瘦_ 前沿技术论文阅读大数据零售
零售IT中的微服务与实时处理：开源工具链与部署策略综述论文信息MicroservicesandReal-TimeProcessinginRetailIT:AReviewofOpen-SourceToolchainsandDeploymentStrategiesAaditaaVashisht(DepartmentofInformationScienceandEngineering,RVCollege
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

论文笔记：CellSense: Human Mobility Recovery via Cellular Network Data Enhancement

1 intro

1.1 背景

1.1.1 蜂窝计费记录（CBR）

1.1.2 CBR+机器学习的挑战

1.1.3 现有工作对CBR稀疏性的解决

1.1.4 CBR 恢复的挑战

1.2 论文的关键技术

1.3 问题定义

1.4 挑战

1.4.1 新地点

1.4.2 感知粒度

2 数据集

2.1 合肥蜂窝计费记录（CBR）

2.2.用户上下文信息

2.3 路网

2.4 人口

3 模型

3.1 系统概览

3.2 初步研究

3.2.1 空间和时间粒度

3.2.2 移动性图构建

3.2.3 Ping-Pong效应和异常值

3.2.4 停留点（staypoint）检测和行程分割

3.2.5 观察和未观察阶段

3.3 集体移动性建模

3.3.1 目标

3.3.2 设计

3.3.3 路线推断

3.3.4 边旅行时间推断

3.4 个体mobility 建模

3.4.1 全局信息模块

3.4.2 上下文信息嵌入。

3.4.3 双向移动性学习

4 实验

4.1 数据

4.2 结果

你可能感兴趣的:(论文笔记,论文阅读)