머신러닝 하시는분들

  • #3486639
    매니저 98.***.233.52 1751

    협업 대상이 머신러닝 하는 사람들인데요.
    저희가 데이터를 제공합니다.
    아직 데이타 빌드업이 안되어서 그렇긴 한데
    데이타 뷰어 + 멀티 베리어블 어날리시스 정도 구현해 놓은거 같아요…

    로드맵이야 어디나 짱짱하게 하지만
    데이타 자체가 로우 스루풋이라
    이게 정말 학습이 될정도로 쌓이려면 몇년 있어 야 할것 같아요.

    그럴바에는 그냥 통계 패키지느 며칠 돌리면 될거 같은데 저희 데이터 가져다가 이상한 결론 내고 막 이상한 이야기를 해요….

    이럴따 어떻게 상사한테 이야기를 해야 그쪽에 얼굴 안붉히고 끝내나여.

    • Qqq 175.***.17.145

      회사는 팩트로만. 팩트외 것을 고민하는 순간 인생 꼬인다.
      깨지더라도 심플 앤 클리어가 장수비결

    • 24.***.108.239

      런닝머신 사랴고 하는데
      어디께 좋느요?

    • CS 169.***.233.18

      현재 데이터로 각각의 방식으로 모델 구현해서 결과 보여주면 되죠

    • 통계 98.***.71.167

      머신러닝 말은 거창하지만 막상 해보면 제 기준에서 가장 중요한건 데이터 자체의 이해도 (Domain Knowledge) 입니다.
      결론이 기존에 생각했던 사고를 크게 벗어나는 수준은 크게 봐서 전체의 5% 정도라고 봅니다.
      현직에 계신 분이 이상한 소리 한다고 느끼시면, 협업 하는 분들이 어떻게든 신박한 결론으로 유도하는게 맞다고 여겨지네요.

      상사분도 글쓴이 분과 비슷한 생각을 하고 있지 않을까요? 대놓고 반박하지 말고 넌지시 얘기해 보는 것도 괜찮을 것 같네요.

    • 123 39.***.244.54

      머신러닝도 분야가 넓고 제대로 하는 사람이 거의 없습니다

      무슨 탑 컨퍼런스 내고 이래야 제대로 머신러닝 잘하는 게 아닙니다

      자기가 가진 자료의 속성에 따라
      어떤 모델을 사용해야 하고 어떤 문제점이 생길 수 있고 이를 수정하기 위해서는 어떻게 해야하는지 알아야하죠

      그러기 위해 도메인 지식을 알아야하고 모르면 데이터를 제공한 사람에게 여러가지 질문을 하면서 분석을 해야합니다
      용어는 다양하지만 데이터 클리닝,전처리를 잘 하는 게 꽤 중요하니까요

      quantative analysis 학위자들이 도메인 지식이 부족한 경우가 많을텐데
      서로 대화가 많아야지 글쓴님이 황당함을 느낄정도로 일방적인 자료분석과 통보란 있을 수 없어요

      제 소견입니다

    • 174.***.17.149

      저도 비스무리한 케이스가 있는데 윗선에 Garbage in garbage out. 이라고 보고합니다.

    • 67.***.157.53

      그분들이 데이터를 가지고 뭘 어떻게 했는지 구체적으로 알아야 얘기가 될거같은데요. 일단 데이터의 obs와 var 각각 얼마나 되는지, 그 데이터를 가지고 모델링한게 예측 모델인지 unsupervised 인지… 예측 모델이면 evaluation이 그래도 가시적이어서 납득할 수준인지 아닌지 현업에서 판단이 가능할거라보구요. unsupervised면 애초에 답이 없는 문제라 현업 계신문들이 디테일하게 결과의 타당성을 파고드셔야할것같네요.

    • 99.***.251.199

      원글님은 뭔가 협업을 잘못생각하고 계시는듯. 협업입니까? 아니면 아웃소싱입니까? 협업을 하면서 상대에게 내가 원하는 답만 달라고 하는건 협업이 아닙니다. 머신러닝을 님팀에 잘 하는 사람이 없으니까 협업을 하는것이고 그럼 그사람들에 specialty를 믿고 존중해 주세요. 그 사람들이 이상한게 아니라 님이 머신러닝을 이해를 잘 못하니까, 용어가 개념이 생소하니까 막 이상한 이야기 처럼 들리는 거죠. 그렇다고 하지 말자고 말하겠다니…….ㅋㅋㅋ. 데이터를 제공받는 사람들은 프로젝트 전반에 걸친 이해도가 떨어질 수 밖에 없어요. 프로젝트를 기획을 한 팀에서 잘 설명을 해주고 대화를 잘 해야 나중에 다시하는 일이 없습니다. 일은 그쪽에서 하니 설명은 님이 하셔야 서로 일하는게 되는것 아닌가요?

      • Re: 흠 75.***.62.2

        밥 그릇 싸움 아닐까요?

        데이터 제공하는 측에서는, 데이터에 관한 설명 제대로 안 해줘야, 자신들의 영역이 보전된다고 생각할 것 같은데요. 데이터에 관한 설명을 제대로 해주는 순간, 자신들의 가치가 떨어진다고 생각할 것 같네요.

        머신 러닝 기법 사용해서 데이터 돌리는 측에서는, 자기네들의 머신 러닝 기법을 실험할 데이터가 필요한데. 데이터에 관해 지식이 없는 상태에서도, 자신들의 기법이 실효성 있다고 무조건 주장해야 자리 보전하겠죠.

        • 99.***.251.199

          원글에 속내야 알 수 없으나 다른 회사하고 협업을 한다면 충분히 가능한 추론입니다. 데이터 제공하는 입장에선 머신러닝 테크닉을 필요로 해서 협업을 하려고 하지만 자세한 설명은 회사입장에서 숨기고 싶어하죠. 데이터도 아마 다 주진 않을걸요 (저도 해봐서 아는데, 좀 좋은 데이터 다른회사로 주려면 VP도 아니고 거의 CEO레벨까지 올라가서 승인을 받았습니다). 머신러닝하는 쪽에서는 데이터가 필요해서 협업을 하지만 그런 입장에선 되도록 결과를 외부에 알리고 싶어하죠. 그래야 자기 선전이 되니까. 아니면 그 기회에 큰회사에서 돈을 받고 프로젝트를 따올 생각이던가. 이런관계는 주로 머신러닝쪽은 스타트업이나 작은 회사. 머신러닝 바탕으로 좋은거 만든다고 해서 투자받은 그수많은 회사들중 하나. 큰회사에 있는 머신러닝부서가 미쳤다고 생기는 것도 없이 남에 데이터가지고 협업을 하진 않죠.

    • 매니저 98.***.233.52

      같은 빌딩안에 옆부서고 (같은 회사)
      제 아래 있는 사이언티스트를 전담으로 붙여서 데이타 클린업하고 피딩을 두달동안 했었습니다.

      그러고 한동안 피드백 이 없다가
      전체미팅에 밑도 끝도없는 결과를 들고나오니 좀 많이 황당해서 그랬어요.
      제 매니저도 빨리 미팅 잡자고 하네여….

    • 지나가다 222.***.55.88

      협업이고 같은 회사 사람이면 할말은 해야죠 ㅋㅋㅋ
      데이터 받아서 분석한 팀은 결론이 어떻게 나왔는지 설명도 안해주나요??? 그건 기본인것 같은데…

Cancel