移动用户画像构建研究


收稿日期:2016-07-05 基金项目:国家自然科学基金项目 “面向电子商务生态平衡的目录导购机制研究”(项目编号:71373015 )的研究成果。 作者简介:黄文彬 (1977-),男,讲师,研究方向:数据科学。 ·方法研究· 移动用户画像构建研究 黄文彬 徐山川 吴家辉 王 军 (北京大学信息管理系,北京 100871) 〔摘 要〕基站通信网络数据蕴含着丰富的移动用户行为,从移动用户频繁活动、规律行为以及移动速度3方 面 建 构 移 动 用户行为画像,可以为个性化服务提供更完整丰富的信息。在分析和挖掘某电信运营商3万位移动用户记录的基站数据的基础 上,本文采用频繁模式挖掘、构建概率矩阵、计算熵等方法,从用户基站日志中所包含的地理位置信息中构建移动用户行为画 像。研究结果表明,该画像模型可显示移动用户的频繁活动规律、周期性行为及出行方式,可作为分析移动用户群体行为及用 户间交互行为的基础。 〔关键词〕移动数据;移动行为;移动用户;用户画像;周期性行为;频繁序列 DOI:10.3969/j.issn.1008-0821.2016.10.009 〔中图分类号〕G252.0  〔文献标识码〕A  〔文章编号〕1008-0821 (2016)10-0054-08 The Profile Construction of the Mobile User Huang Wenbin Xu Shanchuan Wu Jiahui Wang Jun (Information Management,Peking University,Beijing 100871,China) 〔Abstract〕Cellular mobile data service logs contains massive mobile user behavior,based on which mobile user behavior profile,including frequent activities,periodic behaviors and user speed,can be built to provide rich infor- mation for personalized services.Analyzing 30,000usersstation data provided by a telecommunication operator, user profile is built from location sequence by means of frequent pattern mining,probability matrix constructing and entropy calculating.The user profile proposed shows that usersfrequent behavior patterns,periodic behavior pat- terns and speed distribution could be an important reference for further research on population mobile behavior analy- sis and user interaction behavior. 〔Key words〕mobile data;user behavior;mobile user;user profile;periodic behavior;frequent sequences   由于智能手机的普及,人们的生活行为与移动智能设 备连接的更紧密,截止到2014年5月,苹果系统与安卓系 统为主的智能手机操作系统占据了智能手机市场份额的 96.4%[1]。相对于传统的桌 面 端,人们可以随时随地通过 移动终端设备取得服务,各种与移动终端相结合的新兴商 业模式与日俱增,依据用户的地理位置为用户提供基于用 户地理位 置 的 服 务 (LBS)便是一个典型应用,与 此 同 时 用户所携带的手持设备由于服务的需求被动的生成了一系 列包含网络服务基站信息 (如 基 站ID,基站 坐 标)、时 间 信息等内容,并且针对这些数据的分析与挖掘为理解用户 多方面的行为模式提供了至关重要的途径。 移动数据与传统桌面端用户日志主要差异在于提供了 用户的地理位置变化,许多研究将用户的地理位置按时间 排序,采用序列挖掘的算法挖掘用户移动序列的频繁模 式[2-6],并且 Yava?使用所构建的频繁模式对用户将来的 地理位置进行了预测,应用在基站资源的预分配[4]。同时, 探讨如何从比较长期的地理位置日志中挖掘周期性的行为 也是研究热点之一[7-10]。从移动用户数据中构建用户特征 属性可作为识别用户重要依据[11-12],其中Zhu等人除了考 虑地理位置频繁序列之外,通过在手机设备中安装专门的 位置记录软件收集用户地理位置数据并提出频繁停留地点、 频繁移动路径、有意义的地理位置与交通工具4种 用 户 特 —45— 2016年10月 第36卷第10期 现 代 情 报 Journal of Modern Information Oct.,2016 Vol.36 No.10 征来描述用户,构建了更有意义的用户属性[11]。刘瑜等人 提出了利用大数据的方法通过对社交网站签到数据以及其 他信息进行了人类移动模式的研究的流程[13]。除了地理位 置相关的研究 之 外,Tseng等人把用户的地理位置序列与 对应所使用的服务进行了组合,通过挖掘两者共同出现的 频繁模式来预测用户将来的行为[14-15]。此外,Zhu等人把 所有的手机所反映的行为考虑在内,通过手机的原始传感 器数据与自然语言的词相对应,采用自然语言处理中的方 法构建语言模型反映用户行为,并应用于设备被盗检测、 移动应用安全等方面[16]。张慷等人则提出了一个整合客户 资料、语言行为、移动互联网行为等分析用户画像的总体 架构,但在用户属性上缺少细化挖掘分析[17]。由于用户数 据多涉及隐私问题,现有的研究多采用模拟数据或是通过 在手机端安装软件收集少量用户 GPS或基站数据改进用户 频繁序列挖掘算法,并且主要着重刻画某些方面的移动用 户行为,在国内外的研究中,通过海量通信网络服务基站 信息数据建构移动用户画像相对都比较少。 本文采用北京某电信企业记录3万移动用户1个 月 的 移动数据,其中包含用户的通话时间和时长、通 话 基 站 坐 标、网络请求时间、网络请求基站坐标等记录。笔 者 利 用 该数据从频繁活动规律、周期性活动规律、移 动 速 度3个 方面建构移动用户画像的行为属性,实证研究结果显示这 3个方面能够反映真实用户整体的行为习惯,这 对 移 动 用 户行为相关研究及移动服务提供商的用户研究提供了重要 的参考。 1 数据集的处理 本研究的数据为北京某电信企业服务器1个 月 的3万 移动用户数据,时间为 2013年 12月。数据包含用户的基 本信息记录、用户通话日志以及用户网络请求日志,具 体 的数据项目如表1所示。 表1 所获取的用户数据的基本描述 数据集名称 数据集描述 用户通话日志 拨打时间、基站坐标 用户网络请求日志 请求发起的时间、请求服务类型、基站坐标 该数据是典型的基站记录,只在用户手机与基站通讯 时产生的日志,其中用户通话日志共有6百万条记录 与 网 络请求日志共有4亿条记录。相比之下通话日志记录更稀 疏,本研究重点采用网络通讯数据分析用户移动行为。本 研究的网络日志数据预处理的流程见图1。首 先 将 网 络 数 据拆分成基站坐标数据及网络请求数据;由于用户访问 页 面的时候通常伴随着图片、脚本、及其他等诸多请求,笔 者再利用域名、位置等信息对网络请求数据进行压缩,以 提炼出用户真实网络行为;同时,利用国内企 业 提 供 的 地 图 API获取每一个基站坐标的具体地址、周围的建筑和场 所的名称标签、以及商圈资讯等语义化信息。 图1 数据预处理流程     通过数据构建用户画像的前提是该用户有足够的通话 及网络请求日志记录,这批数据里有些用户1个月中 仅 仅 发起了数十条网络请求,因此必须筛选清除网络请求记录 稀疏的用户。本研究将1天按小时分割成24个时段,若用 户在某时段中产生了数据请求,则标记该用户在该时段为 活跃时段,通过筛选活跃时段至少为8的天数大于20天的 用户共计1.6万用户作为主要的研究对象。 2 移动用户行为画像的构建 移动属性的画像构建流程见图2。笔者从数据中所获 取的用户行为坐标并根据用户停留时间的长短分为停留点 与移动点。通过停留点的坐标集合建构用户的周期性活动 规律和频繁活动规律研究用户的生活习惯。其中周期 性 活 动规律是指该用户在1天中各时段停留地理位置的概率分 布,结合基站坐标的语义化信息推断出用户的住家、工 作 场所、偏好地点以及作息规律。频繁活动规律是指该用户 的停留地点之间存在明显的顺序关系,结合基站坐标 的 语 义化信息可推断出用户的活动目的与服务需求。通过 移 动 点的坐标集合建构用户在停留点间的移动路径,通过 该 两 点时间区间的交通路径、时间和速度展现该用户的交通方 式以及选择偏好。   —55— 2016年10月 第36卷第10期 移动用户画像构建研究 Oct.,2016 Vol.36 No.10 图2 地理位置属性构建流程图   2.1 停留点与移动点 本研究采用的数据是电信运营商服务器记录的用户基 站服务日志,并非通过 GPS记录用户精确地理坐标,由于 基站通讯的数据限制,无法细粒度的描述用户的精确坐标 与对应时间,该数据只有当用户与基站通讯时的信息记录, 笔者利用时间区间区分用户停留坐标为停留点或移动点的 定义。假设用户u共有n 个基站请求记录,利用时间tsj 依 序标记该用户 的 坐 标 为locj,则该用户位置与时间序列可 表示成: Traju={[〈tsj,locj〉],j∈[0,n-1]} (1) 其中,将第k∈(0,n-m)段长度为 m∈N 的用户子连 续位置序列表示为: Traju k,m ={[〈tsj,locj〉],j∈[k,k+m-1]}(2) 如果用户子连续位置序列Traju k,m 满足: loci=locj,j,i∈[k,k+m-1],when tsj -tsj+1 ≤Δt and tsm-1-ts0≥ΔT (3) 则这该连续子序列Traju k,m 所记录的移动坐标即为停留 点,而ΔT 即是这个暂留点当时连续的停留时间。如 果 用 户子连续位置序列Traju k,m 满足: loci≠locj,j,i∈[k,k+m-1],when tsj-tsj+1≥Δt (4) 则该 Traju k,m 是一个用户移动路径,所记录的移动坐标 即为移动点,而 ΔT 是移动路径的时间区间。本文 针 对 该 批数据分析处 理 设 置 Δt=5分钟 和 ΔT=30分 钟,并 按 照 以上所定义的概念构建用户的停留坐标、停 留 时 间 区 间、 用户的移动路径以及移动时间区间。 图3 左图为某用户31天的地理位置展示图,右图为记录该用户的暂留点位置展示图     笔者提取数据中某用户31天位置记录并采用上述的定 义进行计算,图3左图显示了该用户整月的停留点和移动 点,其中同颜色是指该时间段属于连续位置子序列,白 色 为信息缺失的部份。图3右图显示将移动点从图上移除后 的结果,可见地理位置快速切换的移动数据已经被剔除, 且综合观察仍可得到长时间驻留地点的信息。 2.2 周期性活动规律计算 为了构建用户在1天中各时段停留地理位置的概率分 布,首先笔者将该用户位置时间序列Traju 转变 成 以 时 间 区间表示用户活动序列BTraju,通过用户的停留点数据构 建用户在不同的时间区段停留的概率值,以进一步清理 在 某时间区段中的不可能长时间规律存在的停留点,分析 用 户的周期性活动规律。假设用户记录的数据总时长个数L 下有n 个停留 区 间,按 照 停 留 点 坐 标loci、停 留 区 间 的 起 始时间STi、停留区间的结束时间 ETi 来表示用户活动序 列BTraju 为: BTraju={[〈loci,STi,ETi〉],i∈[0,n-1]}(5) 则给定任意时 段t中用户是否停留在任意loc 可 表 示 为: gloc,t= 1,loc=loci∧STi≤t≤EIi 0,loc≠loci∧STi≤t≤ET{ i (6) 若以周期 T 的时间观察用户活动规律,且周期 T 包含 d 个离散的时间区段tj∈d ,将则认为用户在时段tj 处于 位 置loci 的概率为: p(loci,tj)= ∑L-1 k=0gloci,tj+dk L (7) 其后将获取一个n×d 的概率矩阵,其中n为该用户的 暂存点坐标个数,d 为周期T 内的时段个 数。本 文 设 置 T =24小时、d=48,即以1天为周期、30分钟 为 时 间 区 段 构建概率矩阵,并针对每个时间区段建构最有可能长时间 规律驻留的停留点,其方法如下: 输入:用户的地理位置概率矩阵。 —65— 2016年10月 第36卷第10期 现 代 情 报 Journal of Modern Information Oct.,2016 Vol.36 No.10 输出:该用户各个时段最有可能长时间规律的停留点。 (1)构建用户tj∈d 个时段处于各个停留点loci∈n 的概率 和 ∑p(loci,tj)。 (2)计算各个时段可能长时间停留坐标的阈值。 a.预先设置用户在某时段处于该位置的概率值τ。 b.针对每个停留点计算,若 ∑p(loci,tj)<τ,则不 认为该时段存在长时间规律的暂留点,此时设置Γtj =-1; 否则设置该时段的长时间规律停留点的阈值Γtj = 1 2 ∑p(loci,tj)。 (3)对各个时段采用阈值列表Γtj 获取长时间规律的停 留点坐标。 最后通过设置概率阈值获取用户各个时段长时间活动 规律停留点的序列,笔者将在本文的3.1节说 明 本 方 法 的 实证结果与示例讨论。 2.3 频繁活动规律计算 为了分析用户的频繁活动规律,笔者首先 将 用 户 停 留 点序列STraju 转变成用户连续的停留点序列: CSTraju={[loci],i∈[0,S-1]} (8) S 是用户所有停 留 点 的 个 数,由于笔者是以天为单为 进行用户序列分析,因此 CSTraju 等于每天的子序列D CSTraju j 的组合。 CSTraju={[DCSTraju j],j∈[1,d]}(9) 那么,我们可以将用户频繁活动规律的挖掘转化为频 繁序列挖掘的问题。我们采用 GSP(Generalized Sequential Patterns)[18]算法对每一个用户的停留坐标序列集挖掘其中 的频繁停留坐标序列,算法如下。 输入:用户每天的子序列DCSTraju j∈d 输出:频繁停留坐标序列 (1)设置k=1。 (2)获取长度为k 的子序列以及子序列的支持度,并 删除支持度小于 minSup的子序列。 (3)利用长度 为k 的频繁序列生成长度为k+1 的 序 列。 (4)k=k+1,跳转到2,直到找不到频繁序列或者不 再有新的子序列。 其中,支持度是指在序列集DCSTraju j∈d 中包含长度 为的子序列的频次,并且最小支持度是 minSup实验参数。 在获取频繁序列之后,在从中选择最长频繁序列作为序列 挖掘的结果,笔者将在本文的3.2节说明该方 法 的 实 证 结 果与示例讨论。 2.4 移动速度计算 笔者引入了熵[11]的概念建构用户当时的移动熵用以刻 画用户在各个时刻的移动速度,利用用户移动点序列 M Traju 进行用户移动熵的计算,并根据时间点t在时间范围 ΔT 内用户出现在不同地点的概率刻画用户的移动速度, 其方法如下: H(t,ΔT)=- ∑N i=1Pt,ΔT (Ci)log2Pt,ΔT (Ci) (10) 其中, Pt,ΔT (Ci)= 1 ΔT∫ t+ΔT 2 t-ΔT 2 I(Ci,rτ)dτ (11) 是用户在时间 t-ΔT 2 ,t+ΔT[ ]2 范围内位于地点 Ci∈M Traju 的概率其中rτ 为用户在时间τ 所处的基站,并 I(Ci,rτ)= 1, Ci=rτ 0,{ others (12) 所计算的移动熵说明用户在时间ΔT 所变化的基站 坐 标越多,相应的其移动速度就越大。如果移 动 熵 为0则 说 明用户没有进行基站的切换。用户的停留时间区间移动熵 为0,用户的移动时间区间通过取等时间跨度的时间节点 可以获取多个时间点的移动坐标,这些坐标可以构建用户 的移动速度图。 3 移动用户画像示例 本章节笔者从周期性活动规律、频 繁 活 动 规 律、用 户 移动速度3个方面通过4个用户的真实数据的实证结果与 示例说明用户的移动行为属性。 3.1 周期性活动规律示例 利用2.2节提出的算法建构每个用户的坐标概率矩阵, 用户1的坐标概率矩阵见图4,横坐标表示1天48个时间 段,纵坐标表示该用户的所有基站坐标。为了 包 含 数 据 隐 私,基站坐标末两码已模糊化处理,图中方块 的 颜 色 由 浅 到深表示该时段在对应坐标的概率逐渐增大。由于基 站 数 据仅能记录用户使用基站的记录,而用户在有 Wi-Fi无线 网的环境使用的网络请求是没有记录的,因此每个用 户 都 会有数据缺失,即用户在各个时段的概率之和小于1。图4 显示该用 户 在 时 段 1~17 (0 点 至 8 点 30 分) 使 用 坐 标 〈116.154xx,40.052xx〉 基 站 的 概 率 大, 在 时 段 19~44 (9点钟至22点钟)使 用 坐 标 〈116.348xx,39.921xx〉基 站的概率大,由此推断该用户住家是在基站 〈116.154xx, 40.052xx〉的覆盖范围内,利用语义化信息查知该基站位 于北京市海淀区温泉镇, 而用户办公场所是在基站 〈116.348xx,39.921xx〉的覆 盖 范 围 内,并 位 于 北 京 市 西 城区万通新世界大厦,同时也可以判断该用户的工作时长 大约都在时段19~44之间,且可能因公务需求偶尔住宿在 其他地方。利用阈值Γtj 删除概率获取该用户的时间规律, 通过与基站的语义化信息进行整合,可以清晰的展现用户 的活动规律表,其结果如表2所示。 —75— 2016年10月 第36卷第10期 移动用户画像构建研究 Oct.,2016 Vol.36 No.10 图4 用户1的概率矩阵   表2 用户1的周期性活动规律表 时 间 基站坐标 语 义 0点到8点30分 116.154xx 40.052xx 住家 (海淀区) 8点半到9点30分 数个坐标值 移动中 9点半到21点30分 116.348xx 39.921xx 办公场所 (西城区) 22点到23点 数个坐标值 移动中 23点以后 116.154xx 40.052xx 住家 (海淀区)   图4表明用户1生活规律性很强,往返于家与办公地, 而停留在其他地理区域的概率非常小,那么虽然用户的办 公地与住家的地理位置相差较远,我们依然认为该用户的 生活范围是比较小的。图5则展示用户2的基站坐 标 概 率 矩阵,在时段1~14 (0点到7点)位于基站 〈116.424xx, 39.892xx〉的概率比较大,而在剩余时段该用户没有明显 的停留坐标点,可推测该用户没有固定的工作地点,并 且 该用户停留的地理位置要比用户1多且物理距离较远,说 明用户2的生活范围较大。 图5 用户2的概率矩阵   3.2 频繁活动规律示例 用户3的频繁停留坐标的序列见表3,该 用 户 频 繁 从 基 站 〈116.381xx,39.973xx〉 到 基 站 〈116.301xx, 39.969xx〉, 或 者 经 由 〈116.410xx,39.906xx〉 再 到 〈116.412xx,39.968xx〉。结合表4基站的语义化信息可以 看出用户频繁从裕民路出发,经过东单再到北京化工大学 —85— 2016年10月 第36卷第10期 现 代 情 报 Journal of Modern Information Oct.,2016 Vol.36 No.10 或直接到中国人民大学活动。 表3 用户3的频繁活动序列 标号 频 繁 序 列 1 116.381xx 39.973xx→116.410xx 39.906xx→ 116.412xx 39.968xx 2  116.381xx 39.973xx→116.301xx 39.969xx 表4 用户3频繁停留坐标序列中坐标的语义化信息 坐标 北京市地址 标  签 116.381xx 39.973xx 朝阳区安贞街道裕民路 12-7号 学校,图书馆,培训机 构,餐饮 116.410xx 39.906xx 东城区东华门街道东长 安街甲2号 地铁站,银行 116.412xx 39.968xx 朝阳区和平街街道北京 化工大学 科教 文 化, 宾 馆 酒 店, 住宅 116.301xx 39.969xx 海淀区海淀街道中国人 民大学 学校, 住 宅, 中 餐 厅, 公园广场   用户3的周期性活动规律 (见图6)表明,该用户晚 间和晨间停留在基站 〈116.381xx 39.973xx〉的概率非常 大,而在上午9点 半 至 19点间停留在基站 〈116.410xx  39.906xx〉的概率大。结合地理语义信息,推 断 用 户 3住 在裕民东里附近并在上午9点半后东单附近工作,再 加 上 该用户标号1的频繁活动序列说明该用户经常从居住地去 工作地后在晚上8点去基站 〈116.412xx 39.968xx〉 (北 京化工大学)附近,推断用户3习惯在下班后在该区域进 行夜间上课学习到深夜才回家。标号2的活动序列 说 明 用 户3从居住地到人民大学区域活动,该序 列 属 于 假 日,推 断该用户在周末会频繁去人民大学上课或进行学术活动。 3.3 移动速度计算示例 图7是用户4某一天的坐标记录,横纵坐标分别为时 间、基站坐标。提取该用户的移动路径,使 用 3.4节的 算 法计算移动熵,如表5所示。考虑到城市交通的拥堵以及 在各个时段交通的速度是有明显的区别的,笔者在这 只 区 分用户步行还是使用其他交通工具,综合观察图7和表5, 做如下描述: 图6 用户3停留基站的概率矩阵   表5 用户4移动路径中各个移动点的移动熵 时 间 移动熵 时 间 移动熵 10∶23  0.995  14∶30  0.891 11∶45  0.921  14∶50  1.466 13∶02  1.202  15∶25  1.000 13∶18  2.139  16∶03  0.999 13∶23  2.164  16∶22  0.000 13∶26  2.487 10点23分该用户的移动熵开始发生变化,并 在 30 分钟内移动路径上有两个邻近坐标的变换且移动熵小于 1.0,推断该用户在基站范围内或附近慢速度的行走移动或 进行购物等活动; 13点02分该用户开始以较高的移动熵进行运动,推 断是该用户使用交通工具进行活动,结合坐标语义可以看出 用户从北京市朝阳区安贞街道经过北太平庄到达海淀黄庄附 近,并随后1个小时内用户正在中关村商圈范围内活动; 随后14点50到 15点 25之间,用户再次使用交通 工具低速移动,从中关村商圈回到北京市朝阳区安贞街道 附近区域并之后停止活动。 —95— 2016年10月 第36卷第10期 移动用户画像构建研究 Oct.,2016 Vol.36 No.10 图7 左图是用户4按照时间的移动点图     综合上述的周期性活动规律、频繁活动规 律、用 户 移 动速度的分析方法并添加坐标语义信息后所获得的用户行 为生活习惯和活动规律容易暴露个人隐私或识别出用户个 人身份,同时也说明对通信数据进行挖掘分析对用户具有 信息安全的疑虑。 4 结 论 本文利用移动网络基站数据从周期性活动规律、频 繁 活动规律以及移动速度三方面构建了移动用户的用户画像, 结合所提供的可视化视图可以清晰地展现出用户地理位置 相关的行为,所获取的属性相互印证和补充,展 现 了1个 用户每天的生活规律和移动情况。由于本文所获取的用户 数据时间跨度仅1个月,笔者只以1天为周期的活 动 规 律 进行挖掘,但这分析结果已经可以推测出用户的工作方式、 住家地点、工作地点、生活规 律、出行方式与模式。由 于 该用户数据存在部分空缺,对用户的微观行为刻画比较有 限,未来笔者会将这移动属性与网络访问信息相结合获取 更准确更细粒度的用户移动行为和偏好。若能将所有用 户 的移动用户画像并且支持用户属性检索,便可以快速检 索 出具有相似特定属性的用户群,便可以针对需求提供用户 相应的个人化服务。 参 考 文 献 [1]Idc.Worldwide Quarterly Mobile Phone Tracker.2014. [2]Lee S C,Paik J,Ok J,et al.Efficient mining of user behav- iors by temporal mobile access patterns [J].Intl J.Computer Science Security,2007,7 (2):285-291. [3]Chen T S,Chou Y S,Chen T C.Mining user movement be- havior patterns in a mobile service environment [J].Systems, Man and Cybernetics,Part A:Systems and Humans,IEEE Transactions on,2012,42 (1):87-101. [4]Yava?G,Katsaros D,Ulusoy,et al.A data mining ap- proach for location prediction in mobile environments [J].Da- ta & Knowledge Engineering,2005,54 (2):121-146. [5]曾灿灿.基于数据挖掘的移动行为预测 [D].武 汉:华 中 科 技大学,2011. [6]王晓 明. 基于移动数据的轨迹模式挖掘算法的研究与应用 [D].沈阳:东北大学,2013. [7]Baratchi M,Meratnia N,Havinga P J M.Recognition of pe- riodic behavioral patterns from streaming mobility data [M]. Mobile and Ubiquitous Systems:Computing, Networking, and Services.Springer International Publishing,2014:102- 115. [8]Li Z,Ding B,Han J,et al.Mining periodic behaviors for moving objects [C]∥Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data min- ing.ACM,2010:1099-1108. [9]Zhang M,Kao B,Cheung D W,et al.Mining periodic pat- terns with gap requirement from sequences [J].ACM Trans- —06— 2016年10月 第36卷第10期 现 代 情 报 Journal of Modern Information Oct.,2016 Vol.36 No.10 actions on Knowledge Discovery from Data (TKDD),2007,1 (2):7. [10]Ji Y,Zhang C,Zuo Z,et al.Mining user daily behavior based on location history [C] ∥Communication Technology (ICCT),2012IEEE 14th International Conference on.IEEE, 2012:881-886. [11]Zhu Y,Zhang Y,Shang W,et al.Trajectory enabled serv- ice support platform for mobile usersbehavior pattern mining [C]. Mobile and Ubiquitous Systems:Networking & Serv- ices,MobiQuitous,2009.MobiQuitous09.6th Annual In- ternational.IEEE,2009:1-10. [12]薛冉.基于地理位置服务的用户移动属性的构建和比较 [D].济南:山东大学,2013. [13]刘瑜,康朝贵,王法辉.大数据驱动的人类移动模式和模型 研究 [J].武汉大学学报:信息科学版,2014,(6):8. [14]Lu E H C,Tseng V S,Yu P S.Mining cluster-based tem- poral mobile sequential patterns in location-based service envi- ronments [J].IEEE Transactions on knowledge and data engi- neering,2011,23 (6):914-927. [15]Tseng V S M,Lin K W C.Mining sequential mobile access patterns efficiently in mobile web systems [C]∥Advanced In- formation Networking and Applications,2005.AINA 2005. 19th International Conference on.IEEE,2005, (2):762- 767. [16]Zhu J,Hu H,Hu S,et al.Mobile behaviometrics:Models and applications [C] ∥ Communications in China (ICCC), 2013IEEE/CIC International Conference on.IEEE,2013: 117-123. [17]张慷.手机用户画像在大数据平台的实现方案 [J].信 息 通 信,2014,(2):266-267. [18]Srikant R,Agrawal R.Mining sequential patterns:General- izations and performance improvements [M].Springer Berlin Heidelberg,1996. (本文责任编辑:马 卓 櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸櫸 ) (上接第53页) 用。因此,本文在参考国内外相关文献的基础上,构 建 了 一套可用于了解用户对分类机制设置偏好的指标体系,并 通过发放调查问卷的方式,了解当前用户使用微信订阅服 务主要情况,以及用户对信息分类机制的设置偏好,继 而 根据对调研结果的分析,提出了建立微信订阅服务中信息 过载防控机制的建议,以期对解决微信订阅服务中信息过 载问题能够起到一定的借鉴意义。但是,本次调 查 对 象 的 年龄主要集中在20~29岁、学历主要在本科以上,对于其 他年龄段、受教育阶段的用户所知甚少,还有待 于 后 续 的 进一步研究,此外,本文只是从理论方面提出了建立微信 订阅服务中信息过载防控机制的建议,并未进行相关的实 证研究,这也需要在以后进一步深化研究。 参 考 文 献 [1]Toffler A.Future shock [M].New York:Bantam Books, 1970. [2] Wurman,Richard Saul:Information Anxiety [M ]. New York,Doubleday,1989. [3]Klapp,Orrin E:Overload and Boredom:Essays on the Quali- ty of Life in the Information Society [M].New York:Green- wood,1986. [4]Casey CJ.Coping with information overload:the need for em- pirical research [J].Cost and management,1992, (4):31 -37. [5]于文莲.网络环境下的信息过载研究 [J].农 业 图 书 情 报 学 刊,2008,20 (11):51-54. [6]蔺 丰 奇, 刘 益. 网络化信息环境中信息过载问题研究综述 [J].情报资料工作,2007,(3):36-48. [7]王娜,任婷.移动社交网站中的信息过载与个性化推荐机制 研究 [J].情报杂志,2015,(8):190-194,176. [8]马捷,闫明,靖 继 鹏.信息生态视角下电子商务网站信息分 类优化研究 [J].情报科学,2012,(3):360-363,407. [9]高翔,基于混合特征的微博信息分类方法研究 [D].北 京: 北京工业大学,2013. [10]吴砥,赵姝,杨晓露,等.学习资源的分类机制与分类标准 的研究 [J].中国远程教育,2009,(1):56-60,79. [11]Thomas Vander Wal.Folksonomy Explanations [EB/OL]. http:∥ www.vanderwal.net/random/entrysel.php?blog= 1622,2016-03-08. [12]A.Mathes.Folksonomies:Cooperative Classification and Com- munication through Shared Metadata[EB/OL].http:∥www. adammathes.com academic computer-med-Iated-communi- cation folksonomies.html,2016-03-08. [13]Sh irky,C (2005)Ontology is overrated:Categories,links and tags [EB/OL].http:∥www.shirky.com writings ontolo- gyoverrated html,2016-03-08. [14]陈树 年. 网 络 信 息 分 类 法 研 究 [J]. 现代图书情报技术, 2002,(3):54-57,80. [15]吴胜,张智光,张长江.网站信息分类体系质量评价指标体 系的研究 [J].图书情报工作,2009,(6):58-61,82. [16]Eppler M J,Mengis J.A frame work for information over- load research in organization [EB/OL].http:∥www.bu.l un is.ich l cerca/bu l/pubblicazioni/com/pdf/w pcao30./pdf, 2016-03-08. [17] Wurman,Richard Saul Bradford,Petered.Information Ar- chitects [J].Library Journal,1996,121 (16):120. [18]邵国川,李晓霞.网络不良信息监督管理对策研究 [J].科 技情报开发与经济,2011,(4):142-145. (本文责任编辑:马 卓) —16— 2016年10月 第36卷第10期 移动用户画像构建研究 Oct.,2016 Vol.36 No.10
还剩7页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

vincewi

贡献于2018-01-09

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf