데이터 엔지니어링은 저희 쪽에서는 raw data, unstructured data등을 분석 가능하게 만드는 작업을 하는데요. Feature engineering 이라고도 하더군요.
전 주로 web api등을 통해 json, xml등을 sql, mongoDB 등으로 사용하게 만들고 sql database 구성(index, stored procedure, ssis package) 등 관리합니다.
실질적으로 end user들도 같은 부서 사람들이고 제가 만든 테이블로 score development를 합니다. 모델은 lightGBM, logistic regression, recommonder system 같은 일반적인 모델이고 주로 sas, python으로 모델링합니디.
결과적으로 전 통계+BI 하는일을 같이 한다고 봐도 되겠네요.