股票基础知识(4)

       根据技术炒股,有一个很重要的技能是看图说话,因为看图可以帮助你判断当前的位置,从而算出未来如何演变:
       这里面看图是第一个步骤,也是最重要的。有效的识别当前的状态,对于未来如何发展至关重要;这个时候不同专业的优势就体现出来,计算机最大的优势是什么。。我们会写程序呀,所以可以把所有的状态都统计出来:


       如何统计所有的状态,有很多种聚类方法,这里只讨论如何计算2条曲线的距离,这个是所有算法的一个基础:
第一步都是归一化,算数归一化、几何归一化都可以,就不细讲了;
       接下来主要讲各种算距离的方法:


1. 欧氏距离:这是最简单的办法,两两算距离平方,相加后取根号;距离越小,越相似;有点是简单,缺点是没办法判断度;
2. 皮尔逊系数:上个方案的问题,引入一个皮尔逊系数,用来判断相关程度;分子是(x-x’)(y-y’)的求和开根号,分母是(x-x’)**2求和开根号乘以(y-y’)**2求和开根号,0.8-1.0是极强,0.6-0.8是强相关,0.4-0.6是中等相关,再往下就不怎么相关,也很简单,数学意义大概是两组向量夹角的余弦;

3. 加速度测试积分位移算法:光看这个名字就高大酷炫叼。。因为看不懂呀;看了看图,我的理解是算两个曲线的面积差的绝对值,分子是这个值的积分,分母是两个曲线面积小的积分,这个比值越接近于0,表明两者之间的距离差越小;

4. Fréchet distance:这是一个法国人提出的算法,直观的解释就是狗绳距离,你去遛狗,无论怎么走,两条曲线的距离是确定的,有上限的。。你唯一需要的就是在不同的时间用一个函数去映射你和狗;

5. 动态时间规整算法dtw:这个是个1970年提出来的算法,差不多快50年了,最开始是因为在语音识别领域里面,不同的人说话的速率不一样,所以有可能有的人在同一个音节上的停留时间是别人的几倍,体现的图像上,就是可能一个图像的若干点,都映射到另外一个图像上的一个点,所以可能在图像上做若干变形,在匹配的效果上就能大大增强,dtw就是这样一个算法,通过动态规划的方式获得两个时间序列的时间对应关系,获得两个序列的最小距离;

6. mfcc:这个是声音处理的常用处理方法,先对声音做一定的预处理,高通滤波或者去噪什么的,然后进行傅里叶变化,把声音数据映射到频域上,然后做mel滤波(根据数据公式变一下),滤波后做反傅里叶变化,然后就得到了mfcc特征,然后根据这个特征对声音做处理;我的理解是把正常的图像数据放到频域上去看,然后做一些滤波,再反傅里叶变化回来,我自己做过若干次实验,觉得这个还是不错的,所以才有那么多做量化基金都会去招一些有声音识别背景的人;


7. simhash,这是一种文本相似度的算法,首先将文本分词,同时得到每个词的权重,将词进行64位hash后,并和权重相乘,得到一个值,将所有词的hash按对应位置相加,得到一个结果,并对其进行降维到0,1,得到文本的唯一标示符,判断两个文本是否相似,就用hamming距离算两个标示符的差就可以了;不过曲线上如何用我还得想想;

8. 蚁群算法:这个是解决最短路径的问题,已知场景的最短路径都是很好解的,Dijkstra,印象中就是找到最小边,然后在他的邻点不断的找最小边加进来就可以了,或者不停找最小边,直到把所有顶点都加进来,但是这种对npc的问题,基本上没办法做,所以就有了蚁群算法,这种类似于蚁群在寻找食物,刚开始每只蚂蚁在寻找食物的时候,都是按照自己的路径来走,同时会在路径上释放自己的信息素,下次再找路他会按信息素最多的路径去走;刚开始,每只蚂蚁都有自己的路,但是随着时间的增加,最短路径的路上蚂蚁会来回的更快,同时会释放更多的信息素,就会有更多的蚂蚁走到最短路径上来;刚开始会比较慢,随着模型的建立之后,就会越来越快~他是一个自优化的过程,这个是做最短路径的时候看到的,觉得有用,就加上了


       simhash考虑的文本内容,使得hash代码会根据文本的意义做更多的加权,这个在算文本相似性的时候,意义很大,同事速度很快,类似于geohash一样,只需要做字符串比对就可以了,性能会很好;如果放到股票里,股票大部分都是数字方面的东西,如何应用也是个问题;


       大部分算法都用过或者实现过,但是基本上都有个性能的问题,同时越简单的算法,往往看到的意义也越直观;复杂的算法有用,但是一般情况下还好,出了问题就一脸蒙逼,这也是基础不牢的人的最大问题;当然现在python大部分时候,都会给你一个成熟的函数,也不需要你来想这些问题;


       本文就简单讲讲这个吧~

长长的财富自由之路

周二讲了做了一个分享,题目是通向财富自由之路,这真是一个硕大无比而又找抽的题目,为了这个蛋疼的题目,辛辛苦苦的准备了3个星期,你说为啥,真是不知道怎么讲,题目这么大,要讲的有逻辑而又不是那么特别空洞,头都疼了。。。

最后的逻辑还是和以往一样,先做背景介绍,讲什么是财富自由,这个是个什么状态,先把题目缩小一点。。不要仅仅只看到钱。。。讲讲财务自由到底指的是什么,用量化的指标讲清楚普通人做到财务自由需要什么,然后把目标进行拆解,分成第一部分要做和第二部分要做的事情;

第二部分开始按照时间顺序,要达到财富自由要做的第一个步骤,就是如何通过工作赚钱,讲清楚工作中最需要掌握的3个技能:找到核心问题和发现关键点、目标拆解和项目管理、口头表达和书面表达,这个也确实是这么多年来的收获;

第三部分讲有了钱之后如何理财,房子和股票,房子从过去两年的判断来看,还是要认真的执行年初的判断,不执行最后都是傻逼。。。股票这个事情还是要多看看盘,多学习,多用机器判断,一定要快点完成

 

股票基础知识(3)

尴尬,写到第三篇就有点黔驴技穷的感觉,没想到我这么多年的炒股经验(接近10年),也只有这么点干货,所以看来还是总结的太少,没有形成方法论导致;但是文章还得继续写哈,那么本篇讲讲炒股的认知偏差:
刚开始炒股的时候,就知道炒股这个东西一半是技术、是理论的事情,另外一半其实是和自己作战,是心理学的事情;所以一开始就把心理学的相关著作都看了一遍,什么行为心理学、认知心理学、心理统计学,图书馆把和心理两个字搭边的都翻了一遍,但是正如从小到大的那句话一样,学会和会用是两码事,即使全部看了看,然后基本上所有的认知偏差和人性弱点,都犯了一遍错,即使现在,也是很难去克服,那么就简单讲讲常见的几个偏差吧:
1. 鸵鸟效应
这个从字面上就很好理解,人在面对危险和消极的时候都会选择逃避,不面对的决定就好像鸵鸟遇到危险把头埋到沙子里一样;换到股票中,当你的股票出现亏损时,投资者会更少的查看手中股票的市值;为啥把这个放到第一条,是因为我最大的几次亏损都是因为这个造成的;15年年初开始的股灾,其实不会亏很多钱的,只要及时止损,基本上没啥损失;然而在这个过程中,还是犯了这个错误,当亏损到一定程度的时候,选择了逃避,间隔了接近3个月没有看盘;回来后,发现遭遇了炒股以来最大的亏损,以至于差点爆仓,只差了那么一点点,就必须清算了;直接的导致了两个结果:1. 接下来的半年,过的特别特别痛苦,每一个操作都小心翼翼,而且生活上基本上要把大部分钱都用来还债,中间还有结婚需要花钱,还要瞒着父母,感谢老婆的支持,不然真的没办法熬过去。。2.把杠杆降到最高2倍;
人都会逃避现实,这是正常的,不仅仅股票,人在碰到很多挫折的时候也是这样,这是人自我保护的一种方式,很多年前我就深受其害,在炒股的过程中又经理了一遍,然而这种性格上的缺陷,靠自己往往很难解决,所以最近正在用程序的方法来解决这些问题,希望能够好好克服;炒股这么多年,看着好多人进进出出,大部分人都败在这一点下面,包括很多其实很牛的人,所以先把这点放在最前面;
2. 瞄定效应
瞄定效应是指的人容易被最近的事情所影响;随便举个例子,找工作的时候谈钱,总是容易被第一个报出来的价格影响,往往双方都会以此作为薪资的合理范围;炒股也是一样,往往会觉得最近的价格是合理的价格,比如全通教育100块的时候,谁都不知道2年左右的时间,就跌到了10块。。不过瞄定效应我还是犯错比较少的。。所以这点还好;
3.虚假一致性偏差
人们往往会高估或者夸大自己的信念、判断和行为的普遍性;当与此相冲突的时候,往往会坚持自己的看法和判断,这里举两个例子:

某程序员结婚第一年有了一个女儿,他想了一下,起名叫玲玲,
后来第二个女儿,起名叫玲依,
第三个女儿,起名叫依玲,
第四个女儿,起名叫依依。
然后。。他有了个儿子,起名的时候难住他了。
于是他想了很久,最后决定叫逸初。

第一个是只有程序员能看懂的笑话,然后下一张是图:
a

4.从众效应
大部分人都会服从少数服从多数的观点,其实大多数多数人的决定都不是最好的决定;

股票在心理上就是一个不断和自己斗争的过程,这是一个漫长而又曲折的过程,这个克服的过程才是股票最大的乐趣之一;

股票基础知识(1)

年轻的时候,读了一本书,叫穷爸爸富爸爸,是本好书,也正是这本书将我误入歧途,让本来可以财务自由的自己,现在还在为生计打拼,可见这本书的威力;那这本书到底讲什么了,其实很简单,他告诉我们一个朴实的道理:
买股票,让你的金钱和公司一起成长,获取超过你预期的收益;
这么多年过去了,我深深的被这个影响着,所以还在这条路上越行越远,其实这句话没有错,只是少了一句话;如何找到好股票,并在上面赚到钱,是一个世界性的难题;所以本文结合我多年的经验,先简单做个开头,之后再系统的介绍一下股票的基本知识,供大家参考:

本文主要讲3个点:
1. 股票是什么,主要的流派:基本面和技术分析
2. 基本面盈利的基础原理
3. 技术面盈利的基础原理

股票是股份公司发行的所有权凭证,是股份公司为筹集资金而发行给各个股东作为持股凭证并借以取得股息和红利的一种有价证券;
以上是百度百科的官方解释,对股民来说包含两个意思,一是所有权凭证,二是有价证券;正是这两点引导出两种基本流派,基本面炒股和技术面炒股;基本面炒股就是《穷爸爸富爸爸》里面说的,我们买股票就是买公司,股票随着公司一起成长,自然就能够赚钱了,所以看到的是股票的所有权,是公司的基本属性;根据这种属性赚钱的,比如巴菲特,国内还有几个,忘记名字了,看好永远的贵州茅台,他们都是基本面炒股,不关心短期的涨跌,看的是公司的基本面;后者说的是有价证券,表示他是一个可以交易的东西,看到是股票的交易属性,是个供需关系,这个时候股票的涨跌取决于看涨的人多还是看跌的人多,买的人多呢,从供需关系来看,自然就涨,这个流派的人比较多,大部分的新手老手、成功的专家,基本都是这一类;当然还有一类是两者的结合,通过基本面分析趋势,通过技术部做打法,比如索罗斯,这是战略和战术的问题;中国也有这一类,不过中国更多的是靠内幕消息,然后制造假的曲线,来忽悠小散户来赚钱的;

我是比较相信技术面的,不过就不在本文说了,这里就简单介绍介绍各个流派赚钱的基本原理:

基本面的就是买公司,先普及几个基本概念:
市值 = 每股价格 * 股本
市盈率 = 当前市场每股价格 / 每股税后利润 = 每股价格*股本 / 每股税后利润*股本 = 市值 / 税后利润
假设我们买的公司是一家上升期公司,每年的增长为30%,而行业的平均的增长为10%,假设公司和行业的平均价格都是10元,那么一年后,如果市盈率不变,行业的平均股票价格增长10%,为11元,而我们买的公司增长30%,也就是13元,这就是基本面的基本原理,我们买的公司,比市场增速快,所以如果价格回归理性的情况下,他肯定会给我们带来超过平均水平的收益;当然做基本面不仅仅是这样,一般还会考虑,当公司被远远低估的时候才买入;因为市场往往会有牛熊,在很多熊市中,公司的价值都被远远低估,两者相结合,就能达到超出预期的收益;而这种操作手法,最大的问题,是操作往往是在熊市,在这个时候,你永远不知道什么时候是最低点,常常会忍受亏损而且更长的投资周期;

技术分析是在于承认3个基本假设:
1. 市场行为包含和消化一切信息
2. 价格以趋势方式演变
3. 历史会重复
如果不认同这个,基本上就不用做技术分析了,所有的技术分析都是建立在这个基础上的,而且这三个也比较好理解,其实就是把股票当成一个供需关系,符合经济学原理,符合博弈论的原理,并在这个基础上操作;然后具体的操作手法,一般的技术分析就是靠经验、靠工具、靠统计,大部分都是偏主观的东西,当然现在也有大奖章、文艺复兴这种高大上的公司,这个可以之后慢慢分析,方法很多,工具很多;

当然还有更高级的方法,比如直接到一级市场上拿原始股,因为在中国,很多都可以通过权力来衍生,以获取金钱,这个不在一般人的讨论中,就不展开了;

基本的就这些,先开个头,然后把这些年发生的事情一件一件讲出来;

股票基础知识(2)

写在前面的话:
本来是想记一次梦幻的西部之旅的,但是旅游达人太多了,那还是继续写点股票的东西吧;

——————————-不是很华丽的分割线———————————————-

我在推荐别人炒股书籍的时候,一般会推荐三本书,《股票作手回忆录》、《股票操练大全》、《海龟交易法则》,这三本是我看过的众多的书中对我触动最大的,非常之好,以至于我觉得第二篇文章的时候一定要推荐出来:

最重要的书是《股票作手回忆录》,他是一本回忆录,记载着作者辉煌而又灿烂的一生;他是讲思想的,讲的是作者在股票这种赌博一样的多人博弈其间的各个心态变化,非常好;股票和赌博一样,会利用一切人性的弱点让你亏钱,不论是贪婪、恐惧,还是自私、懒惰,基本上你能想到的人性的弱点,市场都会拿出来作为打败你的手段,除此之外,还有会使用所有的认知偏差,比如瞄定效应、鸵鸟效应、从众效应,从某种角度上来说,我经常觉得炒股失败的基本上的原因都是心理的因素而不是技术的原因,因为技术这个东西,做到一定的年限,如果你还能在这个市场中活下去,那么必然你还是能找到一种好的技术手段,但是心理因素会从一开始一直纠结到你最后,在你没有离开这个市场之前,任何一次心理的重大问题,都能让你直接out;

《股票操练大全》是第二本书,这本书是真真正正的基础知识大全,告诉你技术炒股的基础知识,非常有用,因为基础知识是一切操作的基石,如果没有这个,炒股肯定是一塌糊涂;但也基本没用,毕竟你学完小学和初中数学,就让你去解决实际数学问题,难度还是挺大的,不过作为初学者,还是强烈建议看一看;

《海龟交易法则》是第三本书,也是本文主要要讲的内容,这是一个被证明成功的方法,他包含一个交易系统的全部模块(我理解的):1. 选市场,2.入场时机,3.离场时机,4.头寸管理;换到股票就是,1.选股,2.什么时候买,3.什么时候卖,4.怎么买和怎么卖,一个完整的系统必须包括这些,而且每一个都很重要;

1. 选市场或者股票,这个是整个操作中最难的地方,也是我到现在也没有特别看明白这个交易系统的地方,我能理解的主要几点:第一,分散投资,保证每个市场的波动不超过整体波动的1%,第二,追强舍弱,选过去一段时间内表现最强的市场,这也是我觉得最纠结的地方,在实际的操作中,选出符合交易法则的股票很多,但是选哪只进行操作,一直是比较纠结的地方,而且在实际的操作中,表现也不是特别好;理论上这是个概率的问题,只要次数足够多,就一定是正向的,但是实际的操作中,一定会出现你没选的走出大趋势,你选出的原地踏步,而且在真实操作中,这种现象很正常;根据历史数据回测也有这个问题,我也没有想到特别好的解决方案,还在凭借经验进行摸索中;

2. 入场时机和离场时机,海龟选择的是唐奇安通道,简单来说,就是突破长期(80日)高点买,低于短期(20日)低点卖,是一个典型的趋势交易;所谓趋势交易,就是判断这是个多头市场,就买入,等到多头市场变成空头市场,则卖出;听起来特别美好,那肯定是赚钱的,但是实际操作的过程中,会出现两个问题,第一、多头和空头往往是反复的,可能这两周市场表现的是多头,到下两周就变成空头了;如果你判断失误,可能你刚刚买入,就进入短期空头的次级趋势中,然后止损后又发现又进入多头市场了,非常痛苦,第二,等到多头和空头打了一仗确定方向之后,基本一波长期趋势已经走完1/3了,这个时候往往又会纠结买还是不买,是否达到一个高点这一类问题,考虑到卖的时候,至少还要砍1/3,会发现去掉鱼头鱼尾后鱼身有可能很短了;这是趋势交易最容易出现的两个问题,非常麻烦,也很难克服;当然趋势交易会有其他的好处,不然早就淘汰了,就是虽然输多赢少,但是往往输一点,但是有可能赢很多,所以整体来看,还是正向的,同时他是右侧交易,所以理论上信号不会太多,免得天天关心股票,天天烦心;
然后继续说海龟交易,这是一个被历史证明成功的策略,但是还是有历史局限性,因为这个理论是发生在上个世纪80年代,计算机还没有普及,所以大家也并没有很好的系统去看均线或者k线什么的,所以他用了一些超过时代的知识赢得一些优势,然而当计算机普及之后,这个优势并不是那么明显了;所以在现在,趋势交易还是一个重要的方向,但是如何做需要仔细考虑,需要更加的细化才能赚钱了

3. 头寸管理,主要是单个市场的波动只能是1%,还有一个,当你亏10%之后,你的本金减少一半,等你用剩下的钱赚回本金了,才能解冻,这能保证你不会因为类似于王者的六连跪。。直接就out出局了,整个交易系统里,这不是最难的,但是是最烦的,而且最难以执行;

1,2,3解决了what,when,how的问题,做了这些能赚钱么?of course not!股票最神奇的就是,你就算知道方法,你也不一定能赚钱,哈哈哈;

这是推荐的3本书,海龟交易法则源于上个世纪80年代,两个人的打赌,一个人说交易员是可以训练出来的,一个人说是不可以的,然后打了个赌,然后说可以的就招了大概10-20个人,培训了几个月到1年吧,然后这些人大部分都成了非常牛逼的交易员,然后管理了很多基金;在过了大概xx年的员工保密期限后,其中几个人把学到的东西写成了书,就是现在的海龟交易法则;

pandas函数

计算30日算术均线:

pd.rolling_mean(data['close'], 30)

计算30日ema

pd.ewma(stock_data['close'], span=30)

按日期从远到近排序:

stock_data.sort(‘date’, ascending=False, inplace=True)

标准差:

pd.rolling_std(data['close'], 26)

 

resample

http://jingyan.baidu.com/article/154b4631140af528ca8f41c9.html