准备VIVA - health economics - [1]

为了准备答辩,正在读自己写的八万字论文,觉得不如趁这个机会把论文里的东西来总结一下,兴许这是最后一次碰自己写的论文了,也为了纪念一下自己的四年博士到底都研究出来点啥。国外各种大牛经常会写点学术博客,感觉自己也写一些,抒发一些这些年来涨的姿势 (:D), 也在答辩前梳理一下论文思路。plus, 就当是knowledge exchange and dissemination 啦。

Title: making what counts be counted: evaluating the use of preference-based outcome measures in Parkinson's disease

Chapter 1开篇

帕金森症状广泛。Parkinson's significantly affects patients' health and wellbeing, not just phycially, but also mentally, and general wellbeing. Parkinson's is not life-threatening, but it is life-disabling. wide range of symptoms, each potentially affecting patients' health, QoL and their overall wellbeing. These impacts are not simply tremor, involuntary movement, speech and language problems and depression, but also relate to patients' self-perception, family relationships and social functioning.

由于症状广泛,其干预措施也多种多样。而目前并没有cure,所以提高生活质量是第一要务。这个长期的疾病,患者每一天的daily life都受到影响,吃饭,睡觉,走路,看电视,和人交谈,各个方面。而这些方面都需要专门的医疗干预来对症实施。

然而,就像其他疾病一样,不能想实施什么干预就要求医疗系统提供什么干预。毕竟,在一个全民医疗系统下,任何的干预都要政府买单。而英国医疗费用就像各国的医疗费用一样,逐年增长。因此,priority setting,资源的优化配置,说白了到底什么医疗干预可以纳入医保,什么医疗干预不能纳入医保,这个问题尤为重要。作为医疗决策者,到底如何选择呢?

退一步来说,把医疗服务如果看作商品,在一个完全市场化的前提下,这完全是由购买者和提供者的行为来决定的,购买者有这个需求,那提供者就提供这个干预,最后达到一种市场平衡 (Pareto efficiency),而technical efficiency, 和allocation efficiency 也同时通过亚当斯密这无形的手来达到。

然而,在医疗行业中,市场化是不能达到的,注定是一个Failure. 这就是market failure, 在讲全民医疗系统中一定要提到的。为什么说提供医疗服务不可市场化呢,原因大概归为四条: 疾病的不确定性,医生患者还有保险公司对病和治疗的不对称信息(患者对自己的症状了解,而医生对治疗干预了解,而保险公司只得依赖双方),医疗服务提供者导致的需求(’过度诊断/治疗‘)以及外部因素 (像一个vaccination program, 免疫了的人群对周边人都是一种Benefit, 避免周边人受感染)。

那既然市场运作在医疗领域行不通,那再回到之前的问题,到底应该如何选择医疗干预来达到最佳的资源优化配置, i.e. 效率最大化呢?

这就要说的我的focus了,一直在做的economic evaluation.

在评价医疗干预的时候,不仅仅要看它是否有效,比如延长了病人多少生命,是否安全,比如是不是有严重副作用,也要看一个医疗干预是否经济。经济学评价考量一个医疗干预的成本和产出。英国目前的NICE(National Institute of Health and Care Excellence) 是英国医疗干预是否能够进入到各大医院的决策者,而NICE所考量的一个重要指标就是cost effectiveness. 通常成本cost是比较tangible的(有形,可用金钱量化),而干预的效果(outcomes)却比较难以定量。干预的效果可以很广泛,涉及生活方方面面,比如帕金森患者的DBS手术(深脑刺激手术),植入一个小的device之后,很多病人的病情可以缓解很多,从跌倒数次到跌倒几次,从手部极度震颤到可以正常操作可以做饭穿衣,etc。所有的这些又会对家庭,日常社交和工作产生非常广泛的影响。而这些影响都可以算作是这个DBS的效果,可这些效果太多太广泛,那怎么样可以测量呢?如果测量不准,又有什么后果呢?

先说后果,测量不准的后果就是应有的outcome没有纳入决策者考量的范围,而导致一个可能有很大benefit的干预进入不到病人的management体系中,说白了就比如说,这个DBS的手术被拒了,那英国的患者就在正常的医疗体系下不能做这个手术了。这就是BBC新闻报道里经常出现的NICE又把哪些患者的哪些hope给deny了 (想想在舆论压力之下,NICE好冤枉,在经济学里一切都是trade off,deny一些intervention是为了社会整体的效益最大化,而放在个体身上,就又另当别论了,个人利益和集体利益,想说NICE能做到现在如此公正真的需要有非常健全的社会价值观来作为基础).

说完后果,说到底目前是如何测量的呢。英国目前用的指标就是QALY了,quality adjusted life years. 翻译过来是生活质量调整年。其实就是把生活质量和生命长度相结合的一个指标。一个干预可以延长的生命长度可以用长期的观测实验或者模型来推测,而生活质量却是一个非常tricky的概念,而这也就是诸多在outcome measurement里学术争辩的核心。

有很多的outcome measures都claim是测量生活质量,但目前被NICE采用的是这个指标叫EQ-5D,测量五个方面:mobility, self-care, usual activities, pain/discomfort, 和 anxiety/depression。这个指标是一个preference based measure, 意思是说它有一套自己的评分系统,而这个评分系统的建立是通过测量偏好的Trade off exercise 来完成的。具体的这些在论文的第二章会提到。而重要的问题是,这五个dimension究竟是否可以定义生活质量呢,是不是和所有的疾病都相关呢,那些更广泛的影响会不会被忽略了呢?

那这个就引出了本论文的题目和rationale。

首先我们要去评测目前的preference-based measures在帕金森领域的应用。英国最大的病人组织,Parkinson's UK已经表示过对目前现有EQ-5D based QALY体系的担忧,认为很多treatment的Value并没有完全的被NICE所考虑。所以这篇论文会review一下当前的measures,看看这些measure是不是有局限性。

之后,由于帕金森最主要的问题是它的comprehensiveness,病人症状的广泛性,口说无凭,就看看目前存在的condition specific outcomes,这些广泛的影响在每一个outcome都有所考虑,像self image, role function, family relationship, 所以可见这些broader wellbeing 是患者关注的一个焦点。而这些如何是否和EQ-5D的dimension来挂钩呢?从EQ-5D里脱离出来,换个角度就是一个非常重要的问题,i.e. 经济学评价如何可以纳入broader benefit呢?这就引出了这篇论文的主角ICECAP-O, 这个新的preference-based capability-wellbeing measure.  

ICECAP-O有很多特点,比如是个非常broad的measure,cover生活的各个方面,真正地define了wellbeing,比如role achievement, family attachment, independence, etc. 第二个特点,就是它focus在capability, rather than functioning. 那这两者啥区别呢?capability在于我能不能,而functioning在于我做不做。这两者什么区别呢,一个经典的例子是为了健康而做的断食vs因为贫穷而忍受的饥饿。两者都是不吃饭,但这两个的效用是完全不同的,所反映的一个人的生活状态也是不同的。而前者在于我可以吃但我不吃,后者在于我没钱所有我不能吃。那同理,可以用于买包包。。我有钱我任性我就不买vs.买不起。。

那我要怎么测评这个新指标呢,这就涉及到了psychometric properties。psychometric properties有众多,而construct validity和responsiveness是两个尤为重要的指标。这俩是干嘛的呢?construct validity, 说白了就是看这个outcome是不是construct的合理,这个定义其实相当含糊,啥叫合理?其实用其检测方法来说明定义要更好理解一些。有两组病人,帕金森早期和帕金森后期,早期病人手只有轻微震颤,还不太影响到生活,而晚期病人每天摔倒数次,吃饭,吞咽,以及入睡都有困难。那我用这个生活质量的量表给这两组病人测一测,是不是最后得分会不同呢?答案顾名思义,是的,不然这量表肯定有问题。那这个就是construct validity。而responsiveness可以算是一个construct validity的longitudinal的概念,有一组病人,处于帕金森早期,给他们量表测量一下生活质量分数,然后过20年,再给他们测量一下这个生活质量,这两个分数肯定是不同的,因为帕金森是progressive的疾病且没有治愈的可能,所以20年以后的整体生活质量水平一定是下降的。

construct validity和responsiveness这两个测评方法就像psychometric properties里的其他很多的测评方法一样,都可以对outcome measure进行unlimited times的评定,从各种各样的角度。他们对于economic evaluation的重要性在于economic evaluation讲究的是incremental benefit between the groups over time, 而这也正符合这两个指标的精神,difference for construct validity 和 change for responsiveness

那这篇论文呢就是通过去测评这两个属性来回答上面提到的两个问题。

waka waka 终于写完了第一章,28页。先给自己点个赞。

你可能感兴趣的:(准备VIVA - health economics - [1])