什麼是垃圾進,垃圾出 (Garbage In, Garbage Out, GIGO) ?
是電腦科學與資訊通訊技術領域的一句習語,說明了如果將錯誤的、無意義的資料輸入電腦系統,電腦自然也一定會輸出錯誤、無意義的結果。同樣的原則在電腦外的其他領域也有體現。
保持模型的簡單並不是愚笨的做法
限制模型的複雜性取決於在開始構建之前知道要選擇哪些變量 (變量取決於相關的領域專家)。 您的業務專家是您了解哪些變量可能會直接影響您嘗試解決的業務問題的最佳來源。 此外,您可以根據經驗確定要包含或排除的變量。
數據準備在於輸入好的數據
導致"垃圾進,垃圾出"情況的常見錯誤包含以下幾種
總結
資料收集是資料處理的前步驟,如果資料準備的細節做好,可以讓資料處理更加的精準且有效率,因此處理資料前就要做好規劃,避免"垃圾進,垃圾出"的情況發生。
文章標籤
全站熱搜
留言列表