其实你自己已经给自己答案了。你为什么不两种方法都试试呢?
不处理outlier,按国家处理outlier,按总样本处理outlier,你分别回归出结果,比较一下。把最理想的结果显示出来,其它的的结果作为robustness test啊。
还一个重要问题事你如何处理outlier,你是删除还是winsorization,这个你要试试看,winsor不减少观察值,是现行比较常用的方法。另外,你把多大比例的数据作为outlier也很重要,一般来讲,数据两端不要超过5%,也就是不超过总样本的10%。数据两端1%,2%,3%都很常见。