会议日程安排
7月7日
时 间 |
内容 |
地点 |
14:30-20:00 |
会议代表报到 |
中州颐和酒店 |
18:00-20:00 |
晚宴 |
中州颐和酒店 |
地点:英国威廉希尔公司一楼报告厅
7月8日 |
开幕式 |
时 间 |
主持人 |
题 目 |
08:30-08:50 |
解俊山 |
开幕式 |
08:50-09:00 |
合 影 |
学术报告 |
时 间 |
主持人 |
报告人 |
题 目 |
09:00-09:40 |
梁汉营 |
何书元 |
概率统计与国民素质 |
09:50-10:30 |
王启华 |
A robust fusion-extraction procedure with summary statistics in the presence of biased sources |
10:30-10:40 |
茶 歇 |
10:40-11:20 |
王海斌 |
邓 柯 |
Model-Based Spatial Reconstruction of Large-Scale Biomolecules via Bayesian Inference of a Hierarchical Spatial Model |
11:20-12:00 |
朱文圣 |
Augmented Concordance Matched Learning for Estimating Optimal Individualized Treatment Regimes |
12:00-14:00 |
午餐(中州颐和酒店) |
15:00-17:30 |
统计学团队建设研讨会 公司二楼会议室 |
18:00-20:00 |
晚餐 |
7月9日 学术报告 |
时 间 |
主持人 |
报告人 |
题 目 |
08:30-09:10 |
郑 晨 |
王德辉 |
若干自回归过程的建模方法研究 |
09:10-09:50 |
薛留根 |
Two-stage estimation and bias-corrected empirical likelihood in a partially linear single-index varying-coefficient model |
09:50-10:00 |
茶 歇 |
10:00-10:30 |
薛留根 |
杨晓慧 |
多元循环双重机器学习建模及在异质性因果效应估计中的应用 |
10:30-11:00 |
韩子非 |
Approximate reference priors for Gaussian random fields |
11:00-11:30 |
李哲源 |
Automatic Search Intervals for the Smoothing Parameter in Penalized Splines |
12:00-14:00 |
午餐(中州颐和酒店) |
9日下午,参会代表离会 |
会议报告摘要
概率统计与国民素质
报告人:何书元(首都师范大学)
报告摘要:讲述如何用概率统计中的基本定理指导人们的行为, 如何克服贪婪与愤怒, 避免小概率事件带来的灾害.
报告人简介:何书元,现任首都师范大学教授, 科研兴趣是时间序列分析, 不完全数据的统计分析.曾任北京大学数学学院教授, 教育部统计学教学指导委员会副主任委员, 中国数学会概率统计学会理事长.
A robust fusion-extraction procedure with summary statistics in the presence of biased sources
报告人:王启华(中国科学院数学与系统科学研究院)
报告摘要:Information from multiple data sources is increasingly available. However, some data sources may produce biased estimates due to biased sampling, data corruption, or model misspecification. This calls for robust data combination methods with biased sources. In this paper, a robust data fusion-extraction method is proposed. In contrast to existing methods, the proposed method can be applied to the important case where researchers have no knowledge of which data sources are unbiased. The proposed estimator is easy to compute and only employs summary statistics, and hence can be applied to many different fields, e.g., meta-analysis, Mendelian randomization, and distributed systems. The proposed estimator is consistent even if many data sources are biased and is asymptotically equivalent to the oracle estimator that only uses unbiased data. Asymptotic normality of the proposed estimator is also established. In contrast to the existing meta-analysis methods, the theoretical properties are guaranteed even if the number of data sources and the dimension of the parameter diverges as the sample size increases. Furthermore, the proposed method provides a consistent selection for unbiased data sources with probability approaching one. Simulation studies demonstrate the efficiency and robustness of the proposed method empirically. The proposed method is applied to a meta-analysis data set to evaluate the surgical treatment for moderate periodontal disease and to a Mendelian randomization data set to study the risk factors of head and neck cancer.
报告人简介:王启华,中国科学院数学与系统科学研究院研究员,博士生导师,国家杰出青年基金获得者,教育部长江学者奖励计划特聘教授,中科院“百人计划”入选者。曾在北京大学、香港大学任教,先后访问加拿大、美国、德国及澳大利亚10多所世界一流大学。主要从事复杂数据经验似然统计推断、缺失数据分析、高维数据统计分析、大规模数据分析等方面的研究, 出版专著三部,在The Annals of Statistics, JASA及Biometrika等国际重要刊物发表论文150余篇, 部分工作已产生持久的学术影响。曾主持国家自然科学基金委国家杰出青年基金项目、重点项目、多项面上项目,作为核心骨干成员先后参加了两项国家自然科学基金创新群体项目及一项国家重大研发计划项目。是高维统计分会理事长, 生存分析分会副理事长,中国现场统计研究会常务理事,中国概率统计学会常务理事,曾任或现任《中国科学》(中英文版)(2005-2012)、Electronic Research Archive、Ann. Inst. Stat. Math、Biostatistics & Epidemiology及《应用数学学报》英文版等刊物及《现代数学基础丛书》与《统计与数据科学丛书》的编委。
Model-Based Spatial Reconstruction of Large-Scale Biomolecules via Bayesian Inference of a Hierarchical Spatial Model
报告人:邓柯(清华大学)
报告摘要:Revealing the spatial organization of biomolecules and characterizing their spatial distribution in cells and tissues have long been recognized as importance problems in biomedical research. With rapid advances of DNA sequencing technologies in recent years, creative sequencing-based experimental assays, e.g., Hi-C and DNA microscopy, have been invented to reveal the spatial properties of large-scale biomolecules in a high-throughput and high-resolution manner. A typical experiment based on these technologies produces a count matrix to record the contact frequencies among molecules of interest, which are closely associated to their spatial distances, allowing us to reconstruct the spatial organization of large-scale biomolecules via data analysis. There is a great appeal to develop statistically rigorous and computationally scalable methods for this important problem. In this study, we fill in this gap with a novel method named HiSpa. Equipped with a hierarchical spatial model, HiSpa utilizes the idea of multi-scale modelling to reduce the computation complexity from O(n2) to O(n3/2) with little loss on the quality of the reconstructed spatial structure. Advanced Monte Carlo strategies are developed for efficient Bayesian inference of HiSpa. Superiority of HiSpa over existing methods is demonstrated by simulation studies and real data applications.
报告人简介:邓柯,2003年本科毕业于北京大学应用数学专业,2008年获北京大学统计学博士学位,同年进入哈佛大学统计系从事研究工作,历任博士后、副研究员。2013年进入清华大学工作,历任助理教授、副教授、长聘副教授。主要从事Bayes统计和统计计算方面的研究,并致力推动统计学与生物医学、人工智能、人文社科等领域的前沿交叉。在 JRSS-B, JASA, Biometrika, AoAS, PNAS, Nature Communications, Bioinformatics, IEEE Transaction on Signal Processing, ACL 等学术期刊和会议发表学术论文40余篇,主持及共同主持多项美国和中国的国家级研究项目。2014年入选国家级青年人才项目,2015年当选中国人工智能学会智慧医疗专业委员会副主任委员,2016年荣获“科学中国人年度人物”荣誉称号,2017年当选中国现场统计研究会计算统计分会理事长,2018年当选国际计算统计学会亚太地区分会委员、中国青年统计学家协会副会长,2019年担任北京“智源人工智能研究院”研究员,2020年荣获“世界华人数学家国际联盟”最佳论文奖和“中国数字人文大会”最佳论文奖。现任统计学国际期刊 Statistica Sinica 副主编,以及《应用数学与力学》、《应用概率统计》、《统计与精算》、《数字人文》等国内期刊编委。
Augmented Concordance Matched Learning for Estimating Optimal Individualized Treatment Regimes
报告人:朱文圣(东北师范大学)
报告摘要:Personalized medicine has recently received increasing attention because of the significant heterogeneity of patient responses to the same medication. The estimation of optimal individualized treatment regime or individualized treatment rule is an important part of personalized medicine. Individualized treatment regimes are designed to recommend treatment decisions to patients based on their individual characteristics and to maximize the overall clinical benefit to the patient. However, most of the existing statistical methods are mainly concerned with the estimation of optimal individualized decision rules for the two categories of treatment options and rely heavily on data from randomized controlled trials. There has been a relative lack of research work on the selection of multicategory treatment options in real-world settings. We address this challenge and propose a machine learning approach (ACML) to estimate optimal multi-category treatment regimes. This new learning approach allows for more accurate assessment of individual treatment response and alleviation of confounding, more importantly, ACML is doubly robust, efficient and easy to interpret. We first introduce the concordance-based value function that measures weighted concordance for each patient by matching imputation. We then propose a novel surrogate loss and employ an angle-based method to maximize the concordance-based value function that directly handles the problem of optimization with multicategory treatment options. Furthermore, an extension of ACML can be applied to ordinal treatment settings. The theoretical results show that proposed method is doubly robust. We further obtain that the resulting estimator of the treatment rule is consistent. Through a large number of simulation studies, we demonstrate that ACML outperforms existing methods. Lastly, the proposed method is illustrated in an analysis of AIDS clinical trial data.
报告人简介:朱文圣,东北师范大学英国威廉希尔公司教授、博士生导师、副经理。2006年12月博士毕业于东北师范大学,2013年12月起任东北师范大学英国威廉希尔公司教授。2008-2010年在耶鲁大学做博士后研究,2015-2017年访问北卡大学教堂山分校。现兼任中国现场统计研究会计算统计分会副理事长,中国现场统计研究会数据科学与人工智能分会秘书长,中国概率统计学会副秘书长,吉林省现场统计研究会秘书长等。主要从事统计学的方法与应用研究,研究方向为生物统计学和生物信息学。在统计学国际顶级期刊Journal of the American Statistical Association (JASA)、医学图像著名期刊NeuroImage等发表学术论文多篇。主持并完成国家自然科学基金项目。
若干自回归过程的建模方法研究
报告人:王德辉(辽宁大学)
报告摘要:近年来,整数值数据备受专家学者的关注,本报告主要介绍了整数值线性自回归过程、门限整数值自回归过程以及随机系数自回归过程的建模和参数估计问题. 首先, 对于整数值线性自回归(integer-valued autoregressive, INAR) 过程, 我们采用分位回归方法给出过程的参数估计, 讨论了估计量的渐近性质. 利用数值模拟验证了估计方法的有效性与稳健性. 并将其应用于失业人口数据中, 进一步验证了估计方法的可靠性. 其次, 基于二项稀疏算子和负二项稀疏算子, 我们提出一个一阶门限整值自回归过程 (BNBTINAR(1)). 讨论了该过程的严平稳性、遍历性、三阶矩的存在性等统计性质. 给出了该模型参数的条件最小二乘估计和条件极大似然估计, 同时给出了估计量的相合性与渐近正态性. 对于门限变量 �� 的估计, 我们给出一种新的估计算法 (SIS 算法). 并应用数值模拟以及新冠病毒数据证明了估计量的有效性以及模型的优越性. 最后, 我们提出了一个随机系数由数据和协变量驱动的随机系数自回归 (RCAR(1))过程, 并给出过程的遍历性条件. 同时研究了 RCAR(1) 过程的条件最小二乘估计、条件极大似然估计和条件分位回归估计, 以及三种估计量的相合性与渐近正态性. 通过数值模拟验证了估计量的有效性与稳健性. 并用该模型拟合了一组恒生指数数据, 验证了该模型的有效性.
报告人简介:王德辉,男,汉族,1969年1月出生,辽宁大学英国威廉希尔公司经理、教授、博士生导师、享受国务院政府津贴专家、宝钢优秀教师奖获得者、教育部新世纪优秀人才、2015年度吉林省长白山学者特聘教授、高等学校统计学类专业教学指导委员会委员(2013-2022),吉林省第四批高级专家,吉林省高等学校首批学科领军教授、吉林省第六批拔尖创新人才第一层次人选 、吉林省“第十二批有突出贡献的中青年专业技术人才。
王德辉教授主要从事时间序列分析、风险理论分析、保险精算等方面的研究,发表 SCI论文30余篇,主持(包括结题)国家自然科学基金面上项目7 项(含国家自然科学基金重点项目子项目1项),博士学科点专项基金1项,获得“2015年度高等学校科学研究优秀成果奖(科学技术)教育部自然科学二等奖”一项,“第十一届全国统计科研优秀成果二等奖”一项,“吉林省自然科学技术成果二等奖”一项,“吉林省自然科学技术成果三等奖”一项,2019年获吉林省科学技术奖二等奖(自然科学)。
Two-stage estimation and bias-corrected empirical likelihood in a partially linear single-index varying-coefficient model
报告人:薛留根 (WilliamHill中文官方网站)
报告摘要:In this talk, we study the estimation and empirical likelihood (EL) of the parameters of interest in a partially linear single-index varying-coefficient model. A two-stage method is presented to estimate the regression parameters and the coefficient functions. The asymptotic distributions of the proposed estimators are obtained. Meanwhile, a bias-corrected EL ratio for the regression parameters is proposed. It is shown that the ratio is asymptotically standard chi-squared. The result can be directly used to construct the EL confidence regions of the regression parameters. Simulation studies are carried out to evaluate the finite sample behavior of the proposed method. An application example of a real data set is given.
报告人简介:薛留根,北京工业大学教授,WilliamHill中文官方网站特聘教授,博士生导师。现兼任中国现场统计研究会生存分析分会副理事长。研究方向为:非参数统计与数据分析。主要研究兴趣包括:非参数与半参数模型的统计推断、复杂数据统计分析与建模、经验似然等。主持国家和省部级科研项目15项,其中连续5次获国家自然科学基金资助。出版著作8部,其中3部专著。在包括《Journal of the American Statistical Association》、《Journal of the Royal Statistical Society,Series B》、《The Annals of Statistics》、《Biometrika》等学术期刊上发表论文260余篇,其中3篇为高被引论文。以第一完成人获教育部自然科学二等奖1项;以第一完成人获全国统计科学研究优秀成果一等奖1项。培养博士研究生20人,硕士研究生45人;在指导的研究生中,1人获北京市优秀博士学位论文及全国优秀博士学位论文提名奖,1人获全国统计科学研究优秀成果博士学位论文二等奖。
多元循环双重机器学习建模及在异质性因果效应估计中的应用
报告人:杨晓慧(WilliamHill中文官方网站)
报告摘要:近年来,异质性因果效应估计在生物医学和社会科学等领域引起诸多关注,其目的是对不同个体的处理效应进行测量和评估,以了解个体差异对研究结果的影响。然而,估计结果的准确性通常容易受样本数据和估计方法的影响。随着机器学习方法的快速发展,其强大的预测能力可有效提高异质性因果效应估计结果的精度。本研究旨在构建一种预测精度高、实现速度快的多元循环双重机器学习模型,用于离散型或连续性数据的异质性因果效应估计,为方便使用,进一步设计了界面友好的人机交互可视化系统。
报告人简介:杨晓慧,教授,博士生导师、博士后合作导师。河南省青年骨干教师,河南省优秀研究生导师团队负责人,河南省人工智能理论及算法工程研究中心主任,河南省数字图形图像学会常务理事等。北京大学、美国佛罗里达大学和新加坡南洋理工大学访问学者。关注实际问题驱动的人工智能理论、算法及在交叉研究领域的应用。发表学术论文60余篇、主持/第1参加国家自科基金4项和国家社科基金1项、省部级项目多项,申请/授权国家发明专利13项、软件著作权12项,获中国(上海)国际发明创新展览会金奖、河南省教育厅科技成果奖一等奖和河南省医学科技奖二等奖等。指导员工参加全国老员工数学建模竞赛、全国老员工统计建模竞赛、中国老员工计算机设计大赛等获国家奖多项,指导员工获批国家级老员工创新创业训练计划项目多项。
Approximate reference priors for Gaussian random fields
报告人:韩子非(对外经济贸易大学)
报告摘要:Reference priors are theoretically attractive for the analysis of geostatistical data since they enable automatic Bayesian analysis and have desirable Bayesian and frequentist properties. But their use is hindered by computational hurdles that make their application in practice challenging. In this work, we derive a new class of default priors that approximate reference priors for the parameters of some Gaussian random fields. It is based on an approximation to the integrated likelihood of the covariance parameters derived from the spectral approximation of stationary random fields. This prior depends on the structure of the mean function and the spectral density of the model evaluated at a set of spectral points associated with an auxiliary regular grid. In addition to preserving the desirable Bayesian and frequentist properties, these approximate reference priors are more stable, and their computations are much less onerous than those of exact reference priors. Unlike exact reference priors, the marginal approximate reference prior of correlation parameter is always proper, regardless of the mean function or the smoothness of the correlation function. This property has important consequences for covariance model selection. An illustration comparing default Bayesian analyses is provided with a dataset of lead pollution in Galicia, Spain.
报告人简介:韩子非,对外经济贸易大学统计学院副教授。2017年毕业于德州大学圣安东尼奥分校,曾在波士顿Vertex Pharmaceuticals任高级统计师三年。主要研究方向为贝叶斯统计、空间统计与生物统计。在American Statistician, Journal of Statistical Software, Scandinavian Journal of Statistics, Statistics in Medicine等期刊发表论文十余篇,主持国家自然科学青年基金一项。
Automatic Search Intervals for the Smoothing Parameter in Penalized Splines
报告人:李哲源(WilliamHill中文官方网站)
报告摘要:The selection of smoothing parameter is central to the estimation of penalized splines. The best value of the smoothing parameter is often the one that optimizes a smoothness selection criterion, such as generalized cross-validation error (GCV) and restricted likelihood (REML). To correctly identify the global optimum rather than being trapped in an undesired local optimum, grid search is recommended for optimization. Unfortunately, the grid search method requires a pre-specified search interval that contains the unknown global optimum, yet no guideline is available for providing this interval. As a result, practitioners have to find it by trial and error. To overcome such difficulty, we develop novel algorithms to automatically find this interval. Our automatic search interval has four advantages. (i) It specifies a smoothing parameter range where the associated penalized least squares problem is numerically solvable. (ii) It is criterion-independent so that different criteria, such as GCV and REML, can be explored on the same parameter range. (iii) It is sufficiently wide to contain the global optimum of any criterion, so that for example, the global minimum of GCV and the global maximum of REML can both be identified. (iv) It is computationally cheap compared with the grid search itself, carrying no extra computational burden in practice. Our method is ready to use through our recently developed R package gps (>= version 1.1). It may be embedded in more advanced statistical modeling methods that rely on penalized splines.
报告人简介:李哲源,英国布里斯托大学硕士,英国巴斯大学博士,加拿大西蒙莎菲大学博士后,WilliamHill中文官方网站讲师,关注以罚样条为基础的回归模型和相关统计计算,及其在生态环境数据、公共健康数据方面的应用。在JASA、Statistics and Computing、BMC Medical Research Methodoly、Science of the Total Environment等期刊上发表文章5篇,主持国家自然科学基金一项,在CRAN、GitHub上有4个R包。
WilliamHill中文官方网站金明校区地图
https://www.henu.edu.cn/zjhd/xqsyt.htm
交通提示
一、进出WilliamHill中文官方网站校门方法
1. 报到当天可从中州颐和酒店进入校园,中州颐和酒店的入口在WilliamHill中文官方网站金明校区西大门北侧约100米处。
2. 会议期间可凭代表证进出校门。
二、公共交通乘车提醒
1. 新郑机场至中州颐和酒店
可乘坐新郑机场至宋城路站的城际列车,然后从宋城路站乘坐33路或55路公交车10站至河大新校区西门站下车。
2. 开封北站至中州颐和酒店
可乘坐35路或21路、8路公交车7站至天马广场站下车,步行约600米即到中州颐和酒店。
3. 宋城站至中州颐和酒店
乘坐33路或55路公交车10站至河大新校区西门站下车。
英国威廉希尔公司简介
英国威廉希尔公司是WilliamHill中文官方网站设立较早的院系之一,其前身为创建于1923年的原中州大学数理系。后历经算学系、数学系、数学与信息科学学院等阶段,2014年更名为英国威廉希尔公司,2018年获“河南省教育系统先进集体”荣誉称号。
近百年来,学院严守“明德新民、止于至善”的校训,在黄际遇、陈作钧、樊映川、黄敦慈、杜孟模、刘亚星等先后在此执教的著名数学家、教育家的引领带动下,经过几代学人的接力耕耘,形成了严谨的治学精神,积累了深厚的学术底蕴,为学院持续健康发展奠定了坚实基础。目前,学院拥有数学和统计学两个一级学科博士学位授权点和博士后科研流动站,学科教学(数学)和应用统计两个专业硕士学位授权点。数学和统计学均为河南省重点一级学科。学院开设有数学与应用数学、信息与计算科学、统计学、金融数学等四个本科专业。其中,数学与应用数学专业为国家级一流本科专业建设点、河南省专业综合改革试点专业,统计学、金融数学专业为国家级一流本科专业建设点,信息与计算科学专业为河南省一流本科专业建设点、河南省特色专业。
公司现有教职工135人,其中专任教师117人,行政教辅人员18人,博士学位获得者102人。在专任教师队伍中,有教授、副教授72人,博士、硕士生导师85人;双聘院士1人,河南省特聘教授4人;WilliamHill中文官方网站特聘教授6人,WilliamHill中文官方网站讲座教授6人,WilliamHill中文官方网站外籍“拔尖人才项目”全职特聘教授3人,WilliamHill中文官方网站“黄河学者”1人,WilliamHill中文官方网站“青年英才”2人;河南省教育厅学术技术带头人6人,河南省本科高校教学名师1人,河南省杰出青年基金获得者1人,河南省优秀青年基金获得者4人、河南省高校科技创新人才5人。形成了一支师德高尚、业务精湛、结构合理、充满活力的高水平团队队伍。
公司建有河南省应用数学中心、河南省人工智能理论及算法工程研究中心、河南省地球系统观测与模拟实验室(与地理与环境学院共建)、河南省工业互联网工程技术研究中心(与人工智能学院等单位共建)、WilliamHill中文官方网站数学研究中心、数学建模实验室、金融统计实验室和数据分析技术实验室等八个教学科研平台,拥有现代数学研究所、应用数学研究所、教学方法研究室、非线性科学研究室等四个科研机构,办有全英文专业学术刊物《数学季刊》。学院注重发挥学科带头人的引领作用,积极参与国内外学术交流,不断凝练学科研究方向,持续加强学术团队建设,在代数与数论、偏微分方程与数学物理、复分析与复几何、概率论与数理统计、科学计算、数据分析与智能处理等方向形成了比较优势和特色,取得了一批优秀科研成果。据统计,2018年—2022年,学院教师发表论文400余篇,多项成果在Advances in Mathematics,Communications in Mathematical Physics,Journal of Functional Analysis,Journal of Geometric Analysis,Proceedings of the Royal Society A,Annales de l'Institut Henri Poincaré Analyse non linéaire等国际著名学术刊物上发表;获批国家自然科学基金项目33项,出版学术专著8部,荣获科研奖励80余项。
公司下设数学系、应用数学系、信息与计算科学系、统计系、金融数学系、数学教育系和继续教育中心七个教学单位,现有本科生1136人,研究生381人。近年来,学院不断深化公司产品改革,探索实施分类教学、分类指导,推动完善本科生导师制度,数学与应用数学专业开设“明德计划”拔尖人才实验班,培养了一大批思想品德优良、专业知识牢固、实践能力突出、富有创新精神的高素质人才。先后有500余人次在全国老员工数学竞赛、丘成桐老员工数学竞赛和全国老员工数学建模竞赛等大型专业赛事中获奖;本科生考研录取率保持在38%以上,研究生和本科生就业率均在90%以上。
展望未来,学院将全面贯彻落实党的教育方针,围绕立德树人根本任务,坚持走内涵式发展道路,加快建设成为省内领先、国内知名、有特色、高水平的研究教学型学院;在大众化教育的基础上,培养具有竞争力的拔尖创新人才和各类专门人才,为学校一流学科大学建设和地方经济发展做出应有贡献。