2020 美賽(MCM)C題翻譯

2020 MCM Weekend 2

問題C:數據的財富

在其創建的在線市場中,亞馬遜爲客戶提供了對購買進行評分和評價的機會。個人評級-稱爲“星級”-使購買者可以使用1(低評級,低滿意度)到5(高評級,高滿意度)的等級來表示他們對產品的滿意度。此外,客戶可以提交基於文本的消息(稱爲“評論”),以表達有關該產品的更多意見和信息。其他客戶可以根據這些評論提交有幫助或無幫助的等級(稱爲“幫助等級”),以協助他們自己的產品購買決策。公司使用這些數據來深入瞭解其參與的市場,參與的時間以及產品設計功能選擇的潛在成功。

陽光公司計劃在在線市場上推出和銷售三種新產品:微波爐,嬰兒奶嘴和吹風機。他們已聘請您的團隊擔任顧問,以識別過去客戶提供的與其他競爭產品相關的評分和評論的關鍵模式,關係,度量和參數,以:1)告知其在線銷售策略;2)識別潛在重要的設計特徵,以提高產品的吸引力。Sunshine Company過去曾使用數據爲銷售策略提供信息,但他們以前從未使用過這種特殊的組合和數據類型。Sunshine Company特別感興趣的是這些數據中的基於時間的模式,以及它們是否以有助於該公司製造成功產品的方式進行交互。

爲了幫助您,Sunshine的數據中心爲您提供了該項目的三個數據文件:hair_dryer.tsv,microwave.tsv和pacifier.tsv。這些數據代表在數據指示的時間段內在亞馬遜市場上出售的微波爐,嬰兒奶嘴和吹風機的客戶提供的評分和評論。還提供了數據標籤定義的詞彙表。提供的數據文件包含您應用於此問題的唯一數據。

要求

  1. 分析提供的三個產品數據集,以鑑定,描述和支持數學證據,有意義的定量和/或定性模式,關係,測度和參數,這些數據將在星級,評論和幫助等級之內和之間進行,這將有助於陽光公司取得成功他們的三個新的在線市場產品。

  2. 使用您的分析解決Sunshine Company市場總監的以下特定問題和要求:
    a. 一旦三種產品在在線市場上出售後,就可以根據評級和評論確定最能爲Sunshine Company跟蹤的數據度量。
    b. 在每個數據集中識別並討論基於時間的度量和模式,這些度量和模式可能表明產品的聲譽在在線市場中正在增加或減少。
    c. 確定最能表明潛在成功或失敗產品的基於文本的度量和基於評級的度量的組合。
    d. 特定星級會引起更多評論嗎?例如,在看到一系列低星級評級之後,客戶是否更有可能撰寫某種類型的評論?
    e. 基於文本的評論(例如“熱情”,“失望”等)的特定質量描述符是否與評分水平緊密相關?

  3. 寫一兩頁給陽光公司市場總監的信,總結您團隊的分析和結果。包括針對您的團隊最有信心地推薦給市場總監的結果的具體理由。

您提交的內容應包括:

  • 一頁摘要表
  • 目錄
  • 一頁至兩頁的信函
  • 您的解決方案不超過20頁,包含摘要頁,目錄和兩頁信函最多24頁。

注意:參考列表和任何附錄不計入頁數限制,應在完成解決方案後出現。您不應使用未經版權法限制使用的未經授權的圖像和材料。確保您引用了想法的來源和報告中使用的材料。

詞彙表

幫助等級:表示在決定是否購買該產品時特定產品評論的價值。

奶嘴:一種橡膠或塑料的舒緩裝置,通常爲乳頭狀,提供給嬰兒吸吮或咬咬。

審查:對產品的書面評估。

星級:在系統中給出的分數,該分數使人們可以對具有多個星級的產品進行評分。

附件:問題數據集

Problem_C_Data.zip
提供的三個數據集包含通過Amazon Simple Storage Service(Amazon S3)從Amazon客戶評論數據集提取的產品用戶評分和評論。

數據集定義:每行代表劃分爲以下幾列的數據。

    市場(字符串):撰寫評論的市場的2個字母的國家代碼。

    customer_id(字符串):隨機標識符,可用於彙總單個作者撰寫的評論。

    review_id(字符串):評論的唯一ID。

    product_id(字符串):該評論所屬的唯一產品ID。

    product_parent(字符串):隨機標識符,可用於彙總同一產品的評論。

    product_title(字符串):產品的標題。

    product_category(字符串):產品的主要消費者類別。

    star_rating(int):評價的1-5星級。

    help_votes(int):有用的投票數

    total_votes(int):評論收到的總票數。

    vine(字符串):基於客戶在撰寫準確而有見地的評論方面所獲得的信任,邀請客戶成爲Amazon Vine Voices。亞馬遜爲Amazon Vine成員提供了供應商已提交給該程序的產品的免費副本。Amazon不會影響Amazon Vine成員的意見,也不會修改或編輯評論。

    verify_purchase(字符串):“ Y”表示亞馬遜已驗證撰寫評論的人在亞馬遜上購買了該產品,並且沒有以大幅折扣收到該產品。

    review_headline(字符串):評論的標題。

    review_body(字符串):評論文本。

    review_date(bigint):撰寫評論的日期
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章