北京大学社会学系 · 02 年连续创业者 · 2×CCF-A

致广大而尽精微

语出《中庸》—— 测量价值,建造工具。

方晗骏 / Fang Hanjun。北京大学社会学系硕士、连续创业者——研究大模型价值评测(ACL 2024 / AAAI 2025),创办「火花数据API」,联合创立开源项目 InkOS。

方晗骏
方晗骏
雪天车窗

0
论文累计引用
ACL · 77AAAI · 36
0
InkOS 生态 GitHub Stars
逐月加速增长

Ventures

正在建造的项目

两次创业都撞上同一堵墙——AGI 时代专业数据的供给不足。于是我决定亲手建造数据基础设施。

InkOS · GitHub Star 累计增长
8k4k01 月2 月3 月4 月5 月 7,295

Selected papers · CCF-A

代表论文

聚焦大模型价值评测与生成式心理测量。两项工作沿时间线排布,保留会议、年份、作者与引用数。

ACL
2024

ValueBench: Towards Comprehensively Evaluating Value Orientations and Understanding of Large Language Models

Y. Ren, H. Ye, H. Fang, X. Zhang, G. Song · ACL 2024 (Long Papers), pp. 2015–2040

77引用
AAAI
2025

Measuring Human and AI Values Based on Generative Psychometrics with Large Language Models

H. Ye, Y. Xie, Y. Ren, H. Fang, X. Zhang, G. Song · Proceedings of the AAAI Conference on Artificial Intelligence, 2025

36引用

Research & internships

学术与实习经历

从价值观理论框架,到大模型评测方法,再到把研究做成可用的数据与工具——研究与实习串成一条线。

2023.06
—2024.12

北京大学智能学院 · 大模型价值观项目组

项目组成员 · 宋国杰课题组 · 北京
  • 共同构建大模型价值评测基准 ValueBench:从 44 份价值测量问卷提取并标注 453 个多维价值维度,主导 10+ 问卷的数据整理与基准质量的人类评估。
  • 提出以 “seek-suggestion” 替代 “self-report” 的价值评估流程,系统评测 6 个主流 LLM;发现充分上下文下可达 80%+ 专家级判断准确率。
  • 负责 GPV(Generative Psychometrics for Values)理论框架构建,基于“选择性感知”理论与社会学评估方法完成理论验证与 Perception 提取评估。
  • 主导兼容 GPT / Claude 的自动化生成框架迭代,实现“模型–数据–任务”解耦,提升长链路数据生成效率。
2023.09
—2023.11

趣加 FUNPLUS · 战略投资

GenAI 投资实习生 · 北京
  • 用 Python + bs4 + GitHub API 搭建自动化数据管道,每日抓取 Arxiv 论文与 GitHub 热门项目,借 GPT-3.5 分类与信息提取,将投研周报从 3+ 天压缩到 1 天。
  • 周报提炼多项技术趋势(2023.09 推荐 Suno.ai、2023.10 推荐 Heygen.ai),支撑高层快速定位高潜方向。
2023.06
—2023.08

北京大学武汉人工智能研究院 · 智能治理研究中心

实习研究员 · 武汉
  • 基于 Schwartz、Rokeach 价值体系搭建适用于大模型价值观建模的理论框架,整理 AI 仿真、智能治理与价值伦理前沿研究,为项目组提供理论支撑。
  • 比较中西价值体系差异:西方偏分析性与系统化建构,以儒家为代表的中国体系更重实证、伦理道德与个人修养。

Education

教育背景

2023.09 — 2026.06(预计)

北京大学

社会学系 · 法学硕士
研究方向:LLM in Social Science、计算社会科学
2019.09 — 2023.06

北京大学

社会学系 · 法学学士
夯实社会学理论与研究方法基础

Writing

博客 · 笔记

近期写作主题,文章陆续上线——把任意一篇的真实链接给我,即可点亮。


方晗骏简历首页
Résumé

完整简历

教育、学术、实习与创业的完整记录,可在线预览或下载 PDF。


Get in touch

联系与外链

欢迎就专业数据、LLM 评测或开源协作交流。