Google-藉關鍵字搜尋次數,引出電影賣座方程式

關於數據與藝文界商業活動關係的研究不勝枚舉。這回,google藉由關鍵詞搜尋量與廣告點擊量導出精準電影賣座預測。嗯,確實頗有意思。我來翻譯歸納Google發表的資料白書(Quantifying Movie Magic with Google Search)裡公布的四個重點:

  • 觀眾使用google搜尋引擎檢索電影關鍵詞的比例在一年中上升了56%(2011-2012)
  • 關鍵詞搜尋次數與廣告點擊量,且包含其他電影相關變數考量(如上映戲院數量,贊助商定位為午夜場與否,座位數的保留等等)導出的賣座程度預測,首映第一周的準確度達92%,後續的預測準確度達90%。(單看關鍵詞搜尋次數,準確度為70%)
  • 預告片搜尋量+上映狀況+淡旺季變數,預測首周票房,精確度達94%
  • 有鑑於48%觀影者都是在購票當天才決定要看哪部電影,首映周後的搜尋量就顯得較無用

報告裡幾個有意思的豆知識:

  • 大作釋出時,用戶傾向搜尋完整電影片名,而非一般性資訊,且所有人搜尋的片名都很單一集中。
  • 反之,電影淡季時,一般性關鍵詞較被使用。顯示多數人還是對電影有興趣,但比較少注意特定電影。如果要搜尋片名,也會搜尋好幾部片名。

簡而言之,就是用數據佐證常識罷了。結論:一窩蜂。其他還有很多資料我懶得一一細讀了。請有興趣的人自己下載原文來看。

其實我最想說的是……他們家的統計數據的作圖很有美感質量。真是太有美感了。要多學習。由pdf的檔案來看是完全的文字結構,不是把圖放上去而已。所以說,大概用了很精美的排版把統計數據另外弄了上去。真是費工有心又美麗。把統計資料直接導入html5結構,排版完,直接輸出成pdf應該是一個很精美的選項。

我說…為什麼我的重點不在數據本身,而在他的數據顯示排版上啊囧。好吧。我在意的數據例如:Figure 1,很淺顯易懂但數值勒?另外,三、四月間與十一月份的乖離是什麼變數造成的,我有點興趣想知道。

趣事補充:

  • Consumer Watchdog對在Google股東大會上不得使用Google glasses這件決議提出抗議。
    • Google股東大會並非禁止Google glasses而只是禁止一切可以攝影和錄音的設備罷了。但是Google glasses的問題點暴露得一覽無遺。
  • Google終止Google Reader的真正理由(Wired.jp
    • 利用者著實地在減少
    • 不如SNS即時,也無法藉由人氣量推斷閱讀優先順序
    • 現代用戶傾向收藏包含各種網站資料的特定類別資訊(例如,Flipboard, zite等等的設計),而非以往那種訂閱單一網站的模式。
其實針對他們終止Google Reader的幾個主要理由,除了使用者減少這點之外,其他我全部反對。可能我是個老古版,認為舊方法更有效率更全面。我有幾個理由:
  • SNS式的資訊:常會漏掉重大新聞。多數的捲軸設計讓你難以追溯過去幾個小時內的重要新聞,而只讓你專注在「當下」重要的新聞。
  • 是誰說要由多數人的喜好來決定我該看哪些文章而不看哪些文章?這種filter機制確實能在忙碌的現代省下很多時間,但如果要掛一個filter,我也要掛自己喜歡的專門服務。為什麼要被限制在某種特定SNS用戶們的喜好上呢?
  • 類別式檢索確實很不錯,但訂閱單一網站也值得保留。兩種都能學習到新的東西。例如,訂閱特定類別,某天會看到沒見過的作者針對相關議題提出很特殊的論點。這時,用戶可能會想用RSS追隨那位作者……。反過來說,用戶本來對「XX」議題沒有興趣,但他固定用RSS追的作者,寫了一篇關於「XX」的議題,用戶可能就此對這個議題產生興趣。所以說…兩個都能學到新東西,各有優劣。究竟是誰覺得有A方案我們就不能有B方案呀?
我對RSS的重度需求,甚至讓我考慮砸錢用fever(我恨feedly的樣板, 加上,我討厭沒有client app可用的東西。這個什麼都只想靠瀏覽器解決的時代,讓我生厭。)

No comments:

Post a Comment