淮安淮阴区光谱仪校准-第三方仪器计量机构
-
¥180.00
不知从何时起,解答计量问题成了我日常生活的一部分。天南海北的读者与同道提出了各种各样的计量问题。这里摘取少量的典型问题,希望对从事实证研究的朋友有帮助。
1、在什么情况下,应将变量取对数再进行回归?
答:可以考虑以下几种情形。
,如果理论模型中的变量为对数形式,则应取对数。比如,在劳动经济学中研究教育率的决定因素,通常以工资对数为被解释变量,因为这是从Mincer模型推导出来的。
第二,如果变量有指数增长趋势(exponential growth),比如 GDP,则一般取对数,使得 lnGDP 变为线性增长趋势(linear growth)。第三,如果取对数可改进回归模型的拟合优度(比如 R2 或显著性),可考虑取对数。
第四,如果希望将回归系数解释为弹性或半弹性(即百分比变化),可将变量取对数。
第五,如果无法确定是否该取对数,可对两种情形都进行估计,作为稳健性检验(robustnesscheck)。若二者的回归结果类似,则说明结果是稳健的。
2、如何理解线性回归模型中,交互项(interactive term)系数的经济意义?
答:在线性回归模型中,如果不存在交互项或平方项等非线性项,则某变量的回归系数就表示该变量的边际效应(marginal effect)。比如,考虑回归方程
y = 1 + 2x + u
其中, u为随机扰动项。显然,变量x对 y 的边际效应为 2,即 x 增加一单位,平均而言会使y增加两单位。考虑在模型中加入交互项,比如
y = α + βx + γz + δxz+ u
其中, x 与 z为解释变量,而 xz为其交互项(交叉项)。由于交互项的存在,故x对 y 的边际效应(求偏导数)为β + δz,这说明 x对 y的边际效应并非常数,而依赖于另一变量z 的取值。如果交互项系数 δ为正数,则 x对 y的边际效应随着 z 的增加而增加(比如,劳动力的边际产出正向地依赖于资本);反之,如果δ为负数,则 x对 y的边际效应随着z的增加而减少。
3、在一些期刊上看到回归模型中引入控制变量。控制变量究竟起什么作用,应该如何确定控制变量呢?
答:在研究中,通常有主要关心的变量,其系数称为 “parameterof interest” 。但如果只对主要关心的变量进行回归(极端情形为一元回归),则容易存在遗漏变量偏差(omittedvariable bias),即遗漏变量与解释变量相关。加入控制变量的主要目的,就是为了尽量避免遗漏变量偏差,故应包括影响被解释变量 y 的主要因素(但允许遗漏与解释变量不相关的变量)。
4、很多文献中有 “稳健性检验” 小节,请问是否每篇实证都要做这个呢?具体怎么操作?
答:如果你的论文只汇报一个回归结果,别人是很难相信你的。所以,才需要多做几个回归,即稳健性检验(robustness checks)。没有稳健性检验的论文很难发表到好期刊,因为不令人信服。稳健性检验方法包括变换函数形式、划分子样本、使用不同的计量方法等,可以参见我的教材。更重要的是,向同领域的经典文献学习,并模仿其稳健性检验的做法。
5、对于面板数据,一定要进行固定效应、时间效应之类的推敲么?还是可以直接回归?我看到很多文献,有的说明了使用固定效应模型的原因,有的则直接回归出结果,请问正确的方法是什么?
答:规范的做法需要进行豪斯曼检验(Hausman test),在固定效应与随机效应之间进行选择。但由于固定效应比较常见,而且固定效应模型总是一致的(随机效应模型则可能不一致),故有些研究者就直接做固定效应的估计。
对于时间效应也好同时考虑,比如,加入时间虚拟变量或时间趋势项;除非经过检验,发现不存在时间效应。如果不考虑时间效应,则你的结果可能不可信(或许x与 y的相关性只是因为二者都随时间而增长)。
6、如何决定应使用二阶段小二乘法(2SLS)还是广义矩估计(GMM)?
答:如果模型为恰好识别(即工具变量个数等于内生变量个数),则GMM完全等价于2SLS,故使用2SLS就够了。在过度识别(工具变量多于内生变量)的情况下,GMM的优势在于,它在异方差的情况下比2SLS更有效率。由于数据或多或少存在一点异方差,故在过度识别情况下,一般使用GMM。
7、在面板数据中,感兴趣的变量x 不随时间变化,是否只能进行随机效应的估计(若使用固定效应,则不随时间变化的关键变量 x 会被去掉)?
答:通常还是使用固定效应模型为好(当然,可进行正式的豪斯曼检验,以确定使用固定效应或随机效应模型)。如果使用固定效应,有两种可能的解决方法:
(1)如果使用系统GMM估计动态面板模型,则可以估计不随时间而变的变量x 的系数。
(2)在使用静态的面板固定效应模型时,可引入不随时间而变的变量 x与某个随时间而变的变量 z 之交互项,并以交互项 xz (随时间而变)作为关键解释变量。
8、对于非平稳序列,能否进行格兰杰因果检验?
答:如果非平稳序列之间存在协整关系,则可进行格兰杰因果检验(Grangercausality test)。这是因为,根据“格兰杰表示法定理”(Granger Representation Theorem),任何协整系统都可写为向量自回归(VAR)模型,即格兰杰因果检验的形式。
反之,如果非平稳序列之间不存在协整关系,则须先将原序列变为平稳过程(比如一阶差分),然后再进行格兰杰因果检验;否则会出现“伪回归”(spuriousregression)问题。
计量该怎样伴我们走向未来?要适应世界科技领域的形势,我想既应着眼世界,更要立足现在,具体应该:一是跟踪国际计量科技的整体发展——国际单位制(SI)面临重大变革。二是新的应用领域内的战略性新兴产业发展对计量科技提出了更高要求。三是国家经济社会发展对计量的需求不断加大,均结合本国社会经济发展的特点开展计量科学研究,建设科学研究和工业技术发展所需的测量能力,进行新技术探索。 一是跟踪国际计量科技的整体发展——国际单位制(SI)面临重大变革。随着现代科技的进步,用基本物理常数来重新定义国际单位制中的大多数基本单位已成为国际计量科技的发展趋势。这是自1960年SI建立以来的重大变革,对于整个世界计量界乃至社会各个领域的测量准确度将产生深远影响。目前世界国家已纷纷开展相关研究并持续攻关,我国紧密跟踪、科学应对,才能使中国计量体系的建设顺应国际计量体系的发展,才能在国际上争取话语权,占据主导地位。
二是新的应用领域内的战略性新兴产业发展对计量科技提出了更高要求。能够促进经济持续发展、提高生活质量的应用新领域中的计量科技与技术(食品安全、环境保护、生物、能源、材料、医学等)在得以发展。例如,太阳能、风能等新能源的发展要求新的计量技术支持;环境变化的监控要求在温度、温室气体量以及海水含盐量等测量方面,建立长期稳定的计量基标准和溯源体系;二氧化碳、氮氧化物及易挥发有机化合物在低浓度时的微量变化的测量将是计量领域的一个挑战;纳米材料的发展及其在航空、航天和安全保障领域的应用,成为使有效测量具有准确度和可溯源性的推动力;医学领域中不论是诊断还是有效而安全的治疗都需要准确可靠、可互认的测量数据支持。以美国为例,美国国家标准与技术研究院(NIST)以促进国家创新、提升工业竞争力为使命,紧密围绕测量科学领域和国家发展战略开展持续而深入的研究工作,目前正在开展的项目包括:可互用智能电网建设,太阳能及存储等能源技术,绿色节能建筑测量和标准;支撑总体经济系统碳排放限制和交易体系的测量与标准,纳米技术相关环境、健康和安全测量与标准;医疗信息技术,支撑医疗领域创新的测量标准和测量技术;信息技术安全,如数字安全,量子信息科学,以及测量科学的量子计量标准和测量技术等。
三是国家经济社会发展对计量的需求不断加大,均结合本国社会经济发展的特点开展计量科学研究,建设科学研究和工业技术发展所需的测量能力,进行新技术探索。
1.推进自主创新和建立创新型国家对计量科技提出新要求。科技创新能力的提高,对测量能力的需求迅速增加,对的测量溯源能力提出更迫切要求。计量科技要实现计量基础研究的技术突破,要储备,要满足科技创新和技术发展对准确有效测量的新要求。
2.发展战略性新兴产业和加速经济结构调整对计量科技提出新要求。信息、生物、纳米、新能源、新材料、装备制造等新技术的研究及产业化依赖更加准确的测量方法和更为的测量手段,尤其是对微观量、复杂量、动态量和多参数综合量的测量溯源提出了一系列新的要求。如何有效评价新能源的使用效率,如何评价新材料的各种特性,如何实现纳米尺度的高准确度测量和量值溯源,如何实现生物技术安全的准确测量、有效分析和量值溯源,都是摆在我国计量科技面前的紧迫任务。
汽车业、船舶业、钢铁业、石化业对力值、扭矩、加速度、压力等机械量的测量准确度提出了更高要求,同时要求进一步拓展测量范围以覆盖更大和更小的量值;有色金属产业、装备制造业需要解决计量器具在高温、高压、强碱、腐蚀等特殊条件下的量值准确性问题;纺织业、轻工业等产业迫切需要将量值快速准确地传递到生产设备上,对仪器设备的现场、在线和快速检测提出了更高要求。
3.维护社会可持续发展和人类生命健康对计量科技提出新要求。监控气候变化需要高准确度的测量,而且与长期稳定的计量基标准建立联系,才能确定在经历一段时间后发生的微小变化。无论是能源生产、输送、交接、使用等环节,还是大气质量、水质污染等评价控制,以及监测和指导用能单位合理用能、减少污染,科学统计分析和评价节能减排指标等,都离不开能源计量和量值溯源关键技术的支撑。
加强食品安全、医疗卫生领域的监管,必然以准确的成分量测量为支撑,以健全的质量体系和量值溯源体系为保障,这对化学、生物领域的计量能力提出了新挑战。
4.如果一个国家缺少国际认可的计量体系和计量基础设施,其出口产品的测量与检测结果就难以得到进口国的承认和接受,这就直接造成了技术贸易壁垒。为了消除国外不合理的非关税壁垒,避免我国出口产品的重复检验和因计量数据的国际互认受制于人,也为了阻止国外不合格产品进入中国市场,我国实现计量基标准的国际等效和在此基础上测量、校准结果的国际互认。
5.加强安全建设对计量科技提出新要求。定位系统(GPS)、俄罗斯的格罗纳斯系统(GLONASS)以及欧洲的伽利略系统等卫星系统的正常运转,其准确性均依赖于时间频率计量基准。更为准确的导航测量及卫星定位技术,将可有效保障并改善空港、海港的导航安全以及航空器、航天器的安全使用,也将为更好、更及时地预测地震和发布海啸警报作出贡献。开发出拥有自主知识产权的各类原子钟和建设高度现代化的时间频率计量体系,是建设我国立自主的定位系统的关键所在,也是防止我国军事力量和安全受制于人的重要手段。在航天航空领域的惯导、自导及自动控制系统中,扭矩传感器得到了广泛运用,其扭矩值的准确测量和控制也为实施定位提供了技术保障。
计量经济学的主要用途或目的主要有两个方面:
1、理论检验。
2、预测应用。
研究对象:
计量经济学的两大研究对象:横截面数据(Cross-sectional Data)和时间序列数据(Time-series Data)。前者旨在归纳不同经济行为者是否具有相似的行为关联性,以模型参数估计结果显现相关性;后者在分析同一经济行为者不同时间的资料,以展现研究对象的动态行为。
新兴计量经济学研究开始切入同时具有横截面及时间序列的资料,换言之,每个横截面都同时具有时间序列的观测值,这种资料称为追踪资料 (Panel data,或称面板资料分析)。追踪资料研究多个不同经济体动态行为之差异,可以获得较单纯横截面或时间序列分析更丰富的实证结论。
涉及到的相关学科:
若是所建立的回归模型在经济意义上没有因果关系,那么这个就是伪回归,例如路边小树年增长率和国民经济年增长率之间存在很大的相关系数,但是建立的模型却是伪回归。如果你直接用数据回归,那肯定存在正相关,而其实这个是没有意义的回归。
为避免伪回归,消除异方差,在不改变时间序列的性质及相关性的前提下,为获得平稳数据,通常会对时间序列取自然对数。对数据进行平稳性检验是研究中不可或缺的步骤,因为时间序列分析法只适用于平稳的数据。那么什么情况下会对数据取对数呢?
,关于对数的问题,若是自己选取的变量数据,里面有部分小于0,或者负数,需要重新考量下,看是否数据或者其他问题,此时肯定是没法取对数;
第二,针对CD 等生产函数等类型的数据分析,由于建模需要,一般需要取对数,此类情况一般会在柯布道格拉斯函数基础上,引入新的变量,包括但不局限于资本和劳动等变量;
第三,平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系
第四,取对数作用主要有:缩小数据的数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。取对数后,可以将乘法计算转换称加法计算。某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,数据更加平稳,也消弱了模型的共线性、异方差性等。例如在会计或者金融等变量的实证研究中,引入变量资产规模等变量,一般会取对数,因为不同行业或者国有、民营等公司的资产规模差距很大,取对数,会缩小差距,使得实证研究更具有针对性。
另外,山大大学陈强老师在计量经济学及stata应用公众号中汇总出如下五种情况:
,如果理论模型中的变量为对数形式,则应取对数。比如,在劳动经济学中研究教育率的决定因素,通常以工资对数为被解释变量,因为这是从Mincer模型推导出来的。
,如果变量有指数增长趋势(exponential growth),比如 GDP,则一般取对数,使得 lnGDP 变为线性增长趋势(linear growth)。
第三,如果取对数可改进回归模型的拟合优度(比如 R2 或显著性),可考虑取对数。
第四,如果希望将回归系数解释为弹性或半弹性(即百分比变化),可将变量取对数。
第五,如果无法确定是否该取对数,可对两种情形都进行估计,作为稳健性检验(robustnesscheck)。若二者的回归结果类似,则说明结果是稳健的。
在经济学中,常取自然对数再做回归,这时回归方程为 lnY=a lnX+b ,两边同对X求导,1/Y*(DY/DX)=a*1/X,b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义
告诉你如何取对数quick\ generate series\ 输入新变量,比如 r=log( ),r就是取完对数后的序列。
很多同学在做实证文章的时候常常问,我的R平方只有0.08到0.09,也就是说我的模型只能解释数据的8%到9%。在实证文章里,特别对于横截面数据来说,有时R平方只有0.05。R平方是什么意思?就是说,我们的模型能解释数据的variance的多少,可能对于绝大部分的variance的解释,经济学家是不知道的
另外,R平方表示模型拟合优度,也就是模型解释力度,此值介于0-1之间,数值越大,说明模型解释力度越大,该值越大越好,在实际研究中,辞职表的意义相对较小,即使该值小于0.4或者更小,也关系不是很大。
R平方与所选取变量多少以及回归有很大关系,经常在会计领域多变量进行回归,此值会很小,所以不必太在乎这个统计量。另外调整R2可以为负数,当调整R2可以为负数时,说明此时R2会很小,几乎为0,此时模型几乎没有意义。就Panel Data的处理而言,建议行平稳性校验。一般完整的实证经济学论文,针对面板数据,会前期进行数据处理,包括描述性分析和平稳性检验的,这个根据期刊的要求或版面要求而定,另外,根据相关要求,一般情况下,由于面板数据主要核心在于回归,包括固定或者随机效应的回归结果,所以有些文章,并没有进行平稳性检验,而为了将面板数据做的高大上,分析更具有针对性,可以进行分类分行业分阶段进行回归,更能说明问题。
而在公司财务领域,研究都是资产负债率等,它们不可能包含单位根,所以我们基本上都不做这个检验。然而,在宏观经济领域,单位根过程很普遍,如果前期学者也证实了单位根过程的存在,一般也都做。所以具体情况,根据相关要求来定。
计量经济学是结合经济理论与数理统计,并以实际经济数据作定量分析的一门学科。计量经济学以古典回归分析方法为出发点。依据数据形态分为:横截面数据回归分析、时间序列分析、面板数据分析等。依据模型假设的强弱分为:参量计量经济学、非参量计量经济学、半参量计量经济学等。常运用的软件:EViews、Gretl、MATLAB 、Stata、R、SAS、SPSS等……