金融信息如何分類?
市場中存在着大量以各種形式存在的信息,有些與金融市場有關,而更多的是與金融市場無關的信息,或者說是噪聲。金融信息是一個泛泛的概念,從廣義上說,一切與金融、經濟相關的消息、知識及資料均認爲是金融信息,更廣泛的還包括金融信息化,如炒股軟件、計量軟件等金融信息處理工具。本書特指的金融信息是具有可度量、可處理、可存儲性質,以便於建立金融模型或者進行金融數據處理的信息。這既包括文本信息如財經新聞報道,也包括數據信息如可直接應用於金融建模的宏觀數據。
下面我們將具體分析金融信息大數據的具體內容以及如何進行分類和運用。金融信息可以按照形式、內容、來源等來分類。
按形式分類
根據信息的表現形式進行分類,可以把金融信息分爲數字形式的金融信息、文本形式的金融信息和圖形形式的金融信息。
(1)數字形式的金融信息是指各種以數字形式公佈的經濟指標或者可以通過直接計算得來的數據信息,如常見的宏觀經濟指標:CPI、PPI、失業率、GDP增長率等。數字形式的金融信息可直接應用於數量分析、模型構造、策略構建,是一種結構化標準化的信息。投資者可以通過橫向比較和縱向比較,分析信息內涵,指導投資決策。
(2)文本形式的金融信息是指以文字形式公佈的金融信息。主要包括財經新聞、公司公吿、分析師觀點、財經博客等。這些信息的特點往往是定性地描述了一件事情的發生及市場參與者的觀點,投資者無法直接將這類信息進行比較或者定量分析,只能依據個人經驗加以判斷。在數量化信息解讀同質化的情況下,對這類信息的解析和反應往往決定了投資者的投資能力。
(3)圖形形式的金融信息是指以圖形形式發佈的新聞資訊。主要包括交易所指數走勢、價格走勢曲線圖、餅形、柱狀圖等。這些信息的特點往往是定量地展示了收益、風險、數量、規模等的發展趨勢以及橫向比較數據。
按內容分類
宏觀經濟信息
宏觀經濟不僅是指國民經濟的總體活動,也是指整個國民經濟或國民經濟總體及其經濟活動和運行狀態,如總供給與總需求;國民經濟的總值及其增長速度;國民經濟中的主要比例關係;物價的總水平;勞動就業的總水平與失業率;貨幣發行的總規模與增長速度;進出口貿易的總規模及其變動等。
宏觀經濟信息主要包括宏觀經濟指標和宏觀經濟政策兩大方面。宏觀經濟指標是體現經濟情況的一種方式,主要指標從內容上分類包括國民經濟指標、通貨膨脹與緊縮、投資指標、消費、金融、財政指標、CPI、M1. M2、進出口總額、GDP等和宏觀經濟相聯繫的指標。從時效方面分類包括滯後指標、同步指標和領先指標。宏觀經濟指標對於宏觀經濟政策起着重要的分析和參考作用。宏觀經濟政策是指政府有意識、有計劃地運用一定的政策工具,調節控制宏觀經濟運行,以達到一定的政策目標。從西方國家第二次世界大戰後的實踐經驗來看,國家宏觀調控的政策目標,一般包括充分就業、經濟增長、物價穩定和國際收支平衡等。主要政策包括收入政策、指數化政策、就業政策、經濟增長政策、區域發展政策、扶持政策。
行業信息
行業一般是指其按生產同類產品或具有相同工藝過程或提供同類勞動服務劃分的經濟活動類別,如飲食行業、服裝行業、機械行業等。根據上市公司主營業務來劃分,投資者通常把上市公司分爲以下行業:科技行業、房地產行業、家電行業、電子信息行業、化工行業、能源行業、汽車行業、金融行業、農林牧副漁業、釀酒食品飲料行業、醫藥行業、冶金行業、紡織行業、機械行業、紙業包裝行業、建材行業、商業行業、綜合類等。
在證券市場中板塊輪動與行業輪動對投資者策略決策的影響都不容小覷,股票市場的板塊效應是我國證券市場的特殊現象,在我國證券市場發展的各個階段都產生過重要的影響。板塊分類與行業分類標準不一。板塊分類可按地域劃分,也可以上市公司的經營業績爲紐帶劃分。板塊也可以根據行業分類進行劃分,有高科技板塊、金融板塊、房地產板塊、釀酒板塊、建材板塊等。
行業與板塊分析在股票投資中的作用非常關鍵和重要。一方面,行業分析可爲股票投資者提供更爲詳盡的行業投資背景。對各行業的一般特徵、經營狀況和發展前景有進一步的瞭解,這樣才能更好地進行投資決策。另一方面,行業分析可協助股票投資者確定行業投資重點。國家在不同時間的經濟政策與對不同地區的政策導向會對不同的行業和地區產生不同的影響,屬於這些行業和位於這些地區的企業會受益匪淺。行業與板塊分析可協助股票投資者選擇投資企業及持股時間。通過對行業所處生命週期和影響行業發展的因素進行分析,投資者可瞭解行業的發展潛力和欲投資企業的優勢所在,這對其最終確定所投資企業及確定持股時間有重要作用。
公司基本面信息
公司信息包括公司基礎信息、公司財務信息和公司交易信息。公司基礎信息主要包括公司性質、股東結構、所屬行業等;公司財務信息包括財務報表中財務指標、會計指標;公司交易信息主要指公司股票價格、成交量、換手率、波動率等。具體來講,基本面信息分析包括公司每股收益、每股淨資產、實際市盈率、分析師市盈率等財務指標;公司概況、股本結構、公司公告、持股情況、經營分析、高管及機構持股分析等。
技術面信息
技術面信息是指反映股價變化的技術指標、走勢形態以及K線組合等。技術面分析指對日換手率、流通市值、異動買入和異動賣出金額等指標的判斷預測和分析。技術分析有三個前提假設:市場行爲包容一切信息、價格變化有一定的趨勢或規律、歷史會重演。
技術分析的主要步驟和方法包括髮現趨勢、支撐和阻力、線條和通道、平均線。找到主導趨勢將幫助您統觀市場全局導向,並且能賦予您更加敏銳的洞察力。一旦發現整體趨勢,就能在希望交易的時間跨度中選擇走勢。支撐和阻力水準是圖表中經受持續向上或向下壓力的點。當這些點顯示出再現的趨勢時,它們即被識別爲支撐和阻力。通道被定義爲與相應向下趨勢線平行的向上趨勢線。兩條線可表示價格向上、向下或者水平的走廊。支持趨勢線連接點的通道的常見屬性應位於其反向線條的兩連接點之間。如果您相信技術分析中“趨勢是您的朋友”的信條,那麼移動平均線將使您獲益匪淺。移動平均線顯示了在特定週期內某一特定時間的平均價格。它們被稱作“移動”,因爲它們依照同一時間度量,且反映了最新平均線。
行爲偏差信息
無論是初涉市場的個人投資者還是精明老練的經紀人或是資深的金融分析師,證券投資者都試圖以理性的方式判斷市場並進行投資決策,但作爲普通人而非理性人他們的判斷與決策過程會不由自主地受到認知過程、情緒過程、意志過程等心理因素的影響以致陷入認知陷阱,導致金融市場中較爲普遍的行爲偏差。
行爲偏差包括過度自信、信息反應偏差、損失厭惡與後悔厭惡、心理賬戶、錨定效應、典型啓示、羊羣效應。另外,投資者的行爲偏差還有賭博與投機(Gambling and Speculation)、心理分隔(Mental Compartment)、遺憾與認知不協調(Re-gretand Cognitive Dissonance)、脫節效應(Disjunction Effect)、歧義想象(Magical Thinking)、注意力反常(Attention Anomalies)、可得性啓發(Availability Heuristic)、歷史無關性(Irrelevance of History)、文化與社會傳染(Culture and Social Contagion)等。
行爲偏差分析主要包括分析師預測一致性、反映程度等指標。
高頻數據信息
高頻數據是時間間隔低於I日的證券交易數據,如股票價格、外匯價格以及成交量等。免費數據都以“日”爲單位,如股票開盤價、收盤價、最高價、最低價、成交量等。股票每個時間點都有一個價格,每隔30分鐘的股票價格數據就是高頻數據。高頻交易基於高頻數據的統計分析,高頻因子分析目前市場使用最爲廣泛的是資金流向指標。
金融衍生信息
金融衍生產品是以貨幣、債券、股票等傳統金融產品爲基礎,以槓桿性的信用交易爲特徵的金融產品,它依賴於基礎資產(UnderLyings)價值變動。金融衍生產品的特點主要體現在零和博弈、跨期性、聯動性、不確定性、高槓杆性、契約性、交易對象的虛擬性等。金融衍生產品的作用有規避風險、價格發現,它是對沖資產風險的好方法。
金融衍生信息是指金融衍生品市場、產品、相關行業的資訊。金融衍生信息的分析方法主要包括對可轉債、公司債收益以及可轉債轉股溢價率等指標的研究和應用。
此外,金融信息還包括突發事件(複合因子的實質是優秀投資家的投資邏輯,不應該算作金融信息)。事件分析包括定向、非定向增發實際發行總股數、定向、非定向增發實際募集總金額、解禁股數佔總股本比例、董監高前三名薪酬總額等和公司事件變動相關的指標研究與應用。
按來源分類
政府機構會定期公佈一些數據信息,如國家統計局公佈的宏觀經濟信息、交易所公佈的交易信息等。這類信息的特點是以特定的時間和特定的格式發佈,具有標準化、數據化等特點。
公司公告信息主要是上市公司爲履行信息披露義務而公開發布的信息。包括公司的年報、半年報等定期發佈的財務報表信息,也包括遇到特定事項而發佈的公告。這類信息往往很具體,涉及面可能就是一個公司,並且一般具有標準化特點,分析和應用格式化。但對公司特定事項的臨時公告一般具備事件性質,往往會對該公司的股票價格和交易量有一定的影響,具體分爲預期中的信息和預期外的信息。
機構和媒體信息是指來自一些特定的行業協會、金融機構發佈的研究報告或者是市場調研、新聞媒體發佈的相關公司的新聞輿情等信息。這類信息有的是第一手信息,有的是轉載的或者經加工的信息,並且信息覆蓋面廣、繁雜、形式多樣且質量不一。
這些數據如何應用到量化投資中去呢,常見的方式是加工成因子的形式,通過對股票或股票池因子分析,尋找股票的Alpha來源。目前,已經出現了有一些比較成熟的機構直接提供加工好的因子,國外的有BARRA,JPmorgan,國內的有深圳國泰安教育技術有限公司。以深圳國泰安教育技術有限公司提供的量化因子倉庫爲例,表2-1展示了常見的量化因子。
表2-1量化因子分類及相關說明
近年來,大數據越來越受到社會各界人士的關注。2013年7月,麥肯錫研究報告顯示:到2020年“大數據”將對美國的經濟產生巨大影響。研究報告把美國經濟劃爲17個板塊,大數據對零售、生產、醫療和政府四個板塊的經濟發展具有重大影響,到2020年這四個板塊預計每年能給美國提供6100億美元的GDP增長量。如圖2-2所示。
圖2-2大數據潛在價值與數據採集難易度
也有一些公司開始用大數據進行基本面研究。如RSMetrics,用沃爾瑪停車場的衛星圖像來做基本面分析來看顧客多不多,並用這個數據來預測沃爾瑪下一個季度收益的好壞。如一些機構用卡車GPS數據看公司貨流的運輸情況,用海輪的航運數據來做基本面方面的研究等。大數據不僅能應用在零售、生產、醫療等領域;同時,大數據也漸漸體現出其在金融投資領域巨大的潛在價值。