当前位置:肿瘤瞭望>资讯>快讯>正文

李健斌教授:大数据在乳腺癌科研中的应用价值丨2024乳腺癌规范化诊疗研修班(二期)

作者:肿瘤瞭望   日期:2024/9/2 11:52:26  浏览量:1328

肿瘤瞭望版权所有,谢绝任何形式转载,侵犯版权者必予法律追究。

《肿瘤瞭望》在研修班现场采访了李健斌教授,围绕大数据在发表科研论文、筛选分析数据以及未来发展趋势等话题展开深入探讨。

编者按:由中国临床肿瘤学会(CSCO)、北京市希思科临床肿瘤学研究基金会和东方临床肿瘤研究中心联合举办的“2024乳腺癌规范化诊疗研修班(二期)”于2024年8月23-25日在北京举行。此次研修班旨在全面提升全国乳腺癌领域临床医生的诊疗水平,通过CSCO BC诊疗指南解读、最新科研成果介绍及临床实践经验分享等形式,传递最新进展,推动乳腺癌规范化治疗进程。会上,解放军总医院李健斌教授分享了利用大数据进行科研并发表论文的经验。《肿瘤瞭望》在研修班现场采访了李健斌教授,围绕大数据在发表科研论文、筛选分析数据以及未来发展趋势等话题展开深入探讨。
 
01
《肿瘤瞭望》:您在利用大数据进行科研论文发表方面有着丰富的经验。能否请您具体谈谈大数据在科研论文选题、数据收集与分析以及结论推导等各个环节中的具体应用?这些应用相比传统方法有哪些显著优势?

李健斌教授:在科研论文的撰写过程中,大数据的应用贯穿了从选题、数据收集与分析到结论推导的各个环节。首先,在选题阶段,大数据能够揭示传统研究难以捕捉的规律和趋势,为科研人员提供新颖的研究视角和假设。其次,在数据收集方面,大数据源自于广泛的临床实践,具有高度的真实性和丰富性,能够克服RCT中样本选择偏倚等问题。然而,也需注意到大数据的随意性可能对数据质量产生影响,因此在分析时需谨慎评估其潜在影响。
 
在数据分析阶段,大数据的复杂性和多样性要求科研人员采用先进的统计方法和数据挖掘技术,以揭示数据背后的深层规律。这些技术包括但不限于机器学习、深度学习等,它们能够处理海量数据,发现传统方法难以识别的关联和模式。相比传统方法,大数据分析的显著优势在于其能够更全面地反映实际情况,提高研究结果的可靠性和普遍性。
 
最后,在结论推导环节,大数据的广泛应用促使科研人员更加注重结论的稳健性和可解释性。基于大数据得出的结论往往需要经过多次验证和修正,以确保其科学性和准确性。同时,大数据也促进了跨学科合作和知识共享,为科研创新提供了强大动力。
 
02
《肿瘤瞭望》:在科研过程中,经常需要处理海量数据。您通常采用哪些工具或方法来高效地筛选和分析这些数据,以确保研究的准确性和可靠性?

李健斌教授:在处理海量数据时,我通常采用多种工具和方法来高效筛选和分析数据。首先,对于简单的数据整理和初步分析,我会使用Excel等电子表格软件来完成比例计算、数据排序等基本操作。对于更复杂的统计分析,如卡方检验等,我会借助SPSS等统计软件来实现。这些工具简单易用,能够满足大部分数据分析需求。
 
然而,面对更为复杂的数据集和更高级的分析需求,我也会考虑使用更专业的数据分析工具和方法。例如,利用Python等编程语言进行数据清洗、转换和建模;采用机器学习算法来挖掘数据中的隐藏模式和关联;以及运用可视化工具来直观展示数据分析结果等。这些工具和方法能够更高效地处理海量数据,提高数据分析的准确性和可靠性。
 
在数据分析过程中,我还特别注重数据质量对分析结果的影响。因此,在数据筛选和分析阶段,我会对数据进行多次验证和修正,以确保其准确性和可靠性。同时,我也会关注不同因素对数据分析结果的影响,如BMI、年龄等变量,以便更全面地解释和推导结论。
 
03
《肿瘤瞭望》:在处理和分析大数据时,科研伦理和个人隐私保护是不可忽视的问题。您认为科研人员在利用大数据时应遵循哪些伦理原则?在保障数据安全和隐私方面有哪些具体措施?

李健斌教授:在利用大数据进行科研时,科研人员必须严格遵守科研伦理原则和个人隐私保护规定。首先,科研人员应明确数据收集的目的和范围,避免过度收集或滥用数据。其次,在数据收集、存储、分析和共享过程中,应采取必要的安全措施来保护个人隐私和数据安全。例如,对敏感信息进行脱敏处理、加密存储和传输等。
 
具体而言,在构建数据库时,科研人员应制定明确的数据保护政策,确保数据在收集、存储和共享过程中得到妥善保护。同时,对于不同中心的数据需求,应建立严格的访问控制机制,确保只有经过授权的人员才能访问相关数据。此外,科研人员还应定期进行数据安全检查和风险评估,及时发现和纠正潜在的安全隐患。
 
在科研伦理方面,科研人员应遵循诚实、客观、公正的原则进行科研活动。在数据分析和结论推导过程中,应坚持科学精神和方法论原则,避免主观臆断和误导性结论。同时,科研人员还应积极参与科研伦理教育和培训活动,提高自身的科研伦理素养和意识水平。
 
最后需要强调的是,所有科研项目都应在获得伦理审查批准后进行。科研人员应严格遵守伦理审查的要求和规定,确保科研项目符合科研伦理原则和个人隐私保护规定的要求。
 
04
《肿瘤瞭望》:对于希望在未来科研道路上利用大数据发表高质量论文的年轻学者,您有哪些建议?您如何看待大数据在未来科研发展中的角色和趋势?

李健斌教授:对于年轻学者而言,在科研道路上利用大数据发表高质量论文是一项充满挑战与机遇的任务。首先,针对资源有限、难以获取多中心数据的问题,我建议年轻学者应着重于构思的创新性。即使只能获取单中心数据,通过巧妙设计研究方案,聚焦于独特的研究视角或新颖的问题,也能产出有价值的研究成果。几十例精心挑选和分析的数据,同样能发表在如《Journal of Clinical Oncology》等顶级期刊上。
 
其次,当有机会接触到多中心数据时,年轻学者应充分利用这一宝贵资源。在完成初步研究目标的基础上,进一步拓展研究思路,与不同领域的专家深入交流,挖掘数据中的更多潜在价值。通过多维度、多层次的分析,可以基于同一批多中心数据发表多篇高质量论文。
 
对于大数据在未来科研发展中的角色和趋势,我认为其重要性将日益凸显。然而,前提是确保数据的优质性和可用性。因此,建立和维护高质量的大数据平台至关重要。这不仅需要科研人员的共同努力,还需要政策制定者、医疗机构等多方面的支持与合作。
 
对于青年医生而言,我建议大家在临床实践中注重病例的规范记录和整理,确保数据的准确性和完整性。这样,在未来进行数据分析和研究时,能够更高效地截取到优质数据,避免资源的浪费。
 
05
《肿瘤瞭望》:基于您目前已有的数据,能否介绍一下中国在乳腺癌特别是早期乳腺癌治疗方面的趋势?

李健斌教授:我们利用自建的数据库及美国Flatrion数据库,对中美两国乳腺癌,特别是早期乳腺癌的治疗情况进行了对比分析。从年龄、分子分型、TNM分期等多个维度来看,我们数据库中的患者年龄更轻,分子分型更偏向于阳性和三阴性乳腺癌,且分期更晚,多集中在2期和3期。这一差异导致了我国新辅助治疗比例相对较高。
 
对于HER2阳性这一特殊亚群的患者,我们观察到单抗(如曲妥珠单抗)的使用率在近年来有显著增长。从原先的不足10%逐渐上升到2021年的88%,甚至在2017年之后超过了美国的使用率。这一变化主要得益于中国医保政策的支持,使得更多患者能够负担得起。
 
展望未来,随着更多政策的出台和支持力度的加大,我们将继续深入分析单抗等靶向药物在HER2阳性早期及晚期乳腺癌中的应用情况。通过真实世界数据的积累和分析,我们有望更清晰地了解这些药物对患者预后的改善作用,从而推动乳腺癌诊疗水平的提升。
 
李健斌教授
博士后、助理研究员
解放军总医院
军事医学研究院生物工程研究所助理研究员
中国临床肿瘤学会乳腺癌专委会(CSCO BC)委员Translational Breast Cancer Research杂志:Managing editor

 

版面编辑:张靖璇  责任编辑:无医学编辑

本内容仅供医学专业人士参考


乳腺癌

分享到: 更多